SDF (Structure-Data File) 是一种用于描述化学分子结构的文件格式,由分子设计工具 (MDL) 提出。
Methane ### 分子
Marvin 02222111352D ### 日期
5 4 0 0 0 0 999 V2000 ###计数行
0.0000 0.0000 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.2990 0.7500 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
-1.2990 0.7500 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
-0.0000 -1.5000 0.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
0.0000 0.0000 -1.0000 H 0 0 0 0 0 0 0 0 0 0 0 0
1 2 1 0 0 0 0
1 3 1 0 0 0 0
1 4 1 0 0 0 0
1 5 1 0 0 0 0
M END
$$$$
这个例子描述了一个甲烷分子,包含一个碳原子和四个氢原子。每个原子的坐标以及它们之间的键都在连接表中明确指出。
每个SDF文件通常包含多个分子的信息,每个分子的信息包括:
-
分子的连接表:这是分子的主要部分,描述了分子中的原子和键的类型、数量和连接方式。它包括以下几部分:
- 标题行:通常包含分子的名称或标识符。
- 计数行:包含原子和键的数量,以及其他的一些关于分子的统计信息。
这一行被称为计数行(counts line),它是SDF文件中每个分子的必要部分。这行提供了分子结构的一些基本统计信息。以下是这一行各部分的详细解释:
- 第一个数字(在这个例子中是5)表示分子中原子的数量。
- 第二个数字(在这个例子中是4)表示分子中化学键的数量。
- 接下来的几个数字(在这个例子中是0 0 0 0)表示其他的一些可选信息,例如立体化学的数量,文本字段的数量等。在这个例子中,所有这些数量都是0,表示这些信息在该分子中不存在或未被记录。
- 999 V2000:这部分是版本信息。V2000表示这个SDF文件遵循的是2000年版的SDF文件格式(V3000是另一种版本)。
所以,这个例子中的"5 4 0 0 0 0 999 V2000"表示这个分子有5个原子,4个化学键,没有其他额外的信息,且遵循的是V2000的SDF文件格式。
- 原子块:每行描述一个原子,包括它的坐标(在三维空间中的 x, y, z 坐标)、元素符号以及其他的一些可选信息。
- 键块:每行描述一个键,包括它连接的两个原子、键的类型(单键、双键、三键或芳香键)以及其他的一些可选信息。
-
数据项:这是可选的部分,包含了关于分子的额外信息。每个数据项都由一个数据头和一个或多个数据行组成。数据头标识了数据项的名称,数据行包含了数据项的值。
-
分子结束标记:一个空行标识了一个分子的结束,并开始描述下一个分子。在文件的最后,一个"$$$$"行标识了文件的结束。
例如,一个简单的SDF文件可以这样:
这段文字 "Marvin 02222111352D" 位于SDF文件的第二行,这行通常被称为头部行 (header line)。头部行通常包含了生成该SDF文件的程序的名称(在这个例子中是 "Marvin")和日期/时间戳。
日期/时间戳通常是一个6位的数字,表示生成这个文件的日期。它的格式是YYMMDDhhmm,其中 YY 是年份的最后两位,MM 是月份,DD 是日期,hh 是小时,mm 是分钟。但在这个例子中,“02222111352D”并不符合这个格式,可能是因为错误或者特定的标记。
最后的 "2D" 或 "3D" 通常表示分子的结构数据是二维的还是三维的。在这个例子中,"2D" 表示这个文件中的分子结构是二维的。
总的来说,这一行的内容可能会因为生成SDF文件的程序的不同而有所不同,但通常它会包含一些关于生成文件的程序和文件生成时间的信息。
网友评论