美文网首页
sdf文件格式

sdf文件格式

作者: 可能性之兽 | 来源:发表于2023-11-07 16:27 被阅读0次

SDF (Structure-Data File) 是一种用于描述化学分子结构的文件格式,由分子设计工具 (MDL) 提出。

Methane  ### 分子
  Marvin  02222111352D          ### 日期

  5  4  0  0  0  0            999 V2000 ###计数行
    0.0000    0.0000    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.2990    0.7500    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.2990    0.7500    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.0000   -1.5000    0.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.0000    0.0000   -1.0000 H   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  1  0  0  0  0
  1  3  1  0  0  0  0
  1  4  1  0  0  0  0
  1  5  1  0  0  0  0
M  END
$$$$

这个例子描述了一个甲烷分子,包含一个碳原子和四个氢原子。每个原子的坐标以及它们之间的键都在连接表中明确指出。

每个SDF文件通常包含多个分子的信息,每个分子的信息包括:

  1. 分子的连接表:这是分子的主要部分,描述了分子中的原子和键的类型、数量和连接方式。它包括以下几部分:

    • 标题行:通常包含分子的名称或标识符。
    • 计数行:包含原子和键的数量,以及其他的一些关于分子的统计信息。

这一行被称为计数行(counts line),它是SDF文件中每个分子的必要部分。这行提供了分子结构的一些基本统计信息。以下是这一行各部分的详细解释:

  • 第一个数字(在这个例子中是5)表示分子中原子的数量。
  • 第二个数字(在这个例子中是4)表示分子中化学键的数量。
  • 接下来的几个数字(在这个例子中是0 0 0 0)表示其他的一些可选信息,例如立体化学的数量,文本字段的数量等。在这个例子中,所有这些数量都是0,表示这些信息在该分子中不存在或未被记录。
  • 999 V2000:这部分是版本信息。V2000表示这个SDF文件遵循的是2000年版的SDF文件格式(V3000是另一种版本)。

所以,这个例子中的"5 4 0 0 0 0 999 V2000"表示这个分子有5个原子,4个化学键,没有其他额外的信息,且遵循的是V2000的SDF文件格式。

- 原子块:每行描述一个原子,包括它的坐标(在三维空间中的 x, y, z 坐标)、元素符号以及其他的一些可选信息。
- 键块:每行描述一个键,包括它连接的两个原子、键的类型(单键、双键、三键或芳香键)以及其他的一些可选信息。
  1. 数据项:这是可选的部分,包含了关于分子的额外信息。每个数据项都由一个数据头和一个或多个数据行组成。数据头标识了数据项的名称,数据行包含了数据项的值。

  2. 分子结束标记:一个空行标识了一个分子的结束,并开始描述下一个分子。在文件的最后,一个"$$$$"行标识了文件的结束。

例如,一个简单的SDF文件可以这样:

这段文字 "Marvin 02222111352D" 位于SDF文件的第二行,这行通常被称为头部行 (header line)。头部行通常包含了生成该SDF文件的程序的名称(在这个例子中是 "Marvin")和日期/时间戳。

日期/时间戳通常是一个6位的数字,表示生成这个文件的日期。它的格式是YYMMDDhhmm,其中 YY 是年份的最后两位,MM 是月份,DD 是日期,hh 是小时,mm 是分钟。但在这个例子中,“02222111352D”并不符合这个格式,可能是因为错误或者特定的标记。

最后的 "2D" 或 "3D" 通常表示分子的结构数据是二维的还是三维的。在这个例子中,"2D" 表示这个文件中的分子结构是二维的。

总的来说,这一行的内容可能会因为生成SDF文件的程序的不同而有所不同,但通常它会包含一些关于生成文件的程序和文件生成时间的信息。

相关文章

网友评论

      本文标题:sdf文件格式

      本文链接:https://www.haomeiwen.com/subject/ywffwdtx.html