1、化工文件格式这篇文章谈论一些共同的分子文件格式,包括用法和转换在他们之间。 它也列出几个来源为自由得到关于互联网的化工数据。通常提供化工信息 文件 或 小河 并且许多格式创造了,以不同程度文献。 格式可以通过三个手段发现(参见化工 MIME 部分) 文件扩展名 (通常 3 封信件)。 这用途广泛,但易碎作为共同的词尾例如“.mol”和” .dat 由许多系统使用,包括非化学制品一个。 自已描述文件 那里格式信息在文件包括。 例子是 CIF 和 CML。 chemical/MIME 类型 由一台化工明白的服务器增加。 内容 1 化工数据的来源 2 化工标记语言 3 蛋白质数据库格式 4 GROM
2、ACS 格式 5 CHARMM 格式 6 Ghemical 文件格式 7 SYBYL 线记法 8 微笑 9 其他共同性格式 10 转换在格式之间 11 化学制品 MIME 项目 12 化学制品 MIME 支持 13 参见 14 参考 15 外部链接 化工数据的来源这自由地可利用的分子数据的来源一个最后的名单。 比这里被列出有许多资源那里在互联网。 这些来源的链接在参考如下被给。1. 美国 健康全国学院 PubChem 数据库是化工数据的一个巨大的来源。 所有数据在二维度。 数据包括 SDF、微笑、PubChem XML 和 PubChem ASN1 格式。 2.蛋白质数据库是一个优秀蛋白质来源
3、分子数据。 数据是三维和,假设以蛋白质数据库(PDB) 格式。 3.eMolecules 是一个商业数据库为分子数据。 数据包括一张二维结构图和微笑串为其中每一化合物。 eMolecules 支持根据分子结构的部分的快速亚结构搜寻。 4.ChemExper 是一个商业数据库为分子数据。 查寻结果包括一张二维结构图和一个痣文件为许多化合物。 5.纽约三维分子结构大学图书馆。 6.美国环境保护代办处分布的结构搜查的毒力(DSSTox)数据库网络是 EPA的计算毒素学节目项目。 数据库提供 SDF 分子文件以焦点在致癌物质和否则毒性物质。 化工标记语言化工标记语言 (CML)是一个开放标准为代表分子
4、和其他化工数据。 开放来源项目包括 XML 图解、原始代码为解析和与 CML 数据一起使用和一个活跃社区。 为与化工标记语言一起使用和 XML 的文章工具为化学和生物科学较详细地谈论CML。 CML 数据文件由许多工具接受,包括 JChemPaint, Jmol, XDrawChem 并且 MarvinView。蛋白质数据库格式蛋白质数据库格式 为蛋白质是常用的,但它可以为分子的其他类型使用。 它最初被设计了作为固定专栏宽度格式和正式地因而有原子的一个固定最大数字; 然而,许多工具可能读超出极限的文件。 某一 PDB 文件包含描述原子连通性的一个任意部分并且位置。 由于这些文件有时用于描述代表
5、的大分子汇编或分子 明确溶剂他们可以增长非常大并且经常是压缩的。 有些工具,例如 Jmol能读 PDB 文件 gzipped 格式。 PDB 维护 PDB 文件格式和它的 XML 选择, PDBML 的规格。 典型的文件扩展名为 PDB 文件是 .pdb,虽然一些更旧的文件用途 .ent 或 .brk. 一些分子塑造的工具写适应基本格式他们自己的需要的非标准 PDB 样式文件。GROMACS 格式GROMACS 文件格式家庭被创造了为使用与分子模仿软件包裹 GROMACS. 它严密类似 PDB 格式,但为存放产品设计从 分子动力学 模仿,因此它考虑到另外的数字精确度和任意地保留关于微粒的信息
6、速度 并且位置在特定点在模仿弹道。 它没考虑到连通性信息存贮,在 GROMACS 得到从分开的分子和系统拓扑结构文件。 典型的文件扩展名为 GROMACS 文件是 .gro.CHARMM 格式CHARMM 分子动力学包裹可能读和写一定数量的标准化学制品和生物化学的文件格式; 然而,卡片(座标)和 PSF (蛋白质结构 文件)对 CHARMM 是主要独特的。 卡片形式是固定专栏宽度,类似 PDB 格式和为存放原子座标完全使用。PSF 文件包含描述原子债券) 的原子连通性信息(和在开始模仿之前需要。 半新的典型的文件扩展名是 .crd 并且 .psf 分别。Ghemical 文件格式Ghemica
7、l 软件可能使用 OpenBabel 进口和出口一定数量的文件格式。 然而,默认情况下,它使用 GPR 格式。 这个文件由几个零件编辑,分离由标记 (! 倒栽跳水,! 信息,! 原子,! 债券,! Coord,! PartialCharges 和! 末端)。提出的 MIME 类型为这个格式是 application/x-ghemical.SYBYL 线记法SYBYL 线记法 (SLN)是化学制品 线记法. 凭微笑,它合并完全句法为指定相对立体化学。 SLN 有考虑到 Markush 询问的规格的富有的询问句法。 句法也支持组合图书馆的规格。例子 SLNs描述 SLN 串苯 C 1 H :CH
8、: CH :CH :CH :CH :1胺基代丙酸 NH2C s=n H (CH3) C (=O) OH显示 R 侧链的询问 R1 hac 1 C 1 :C :C :C :C :C :1询问为氨化物或 sulfamide NHC=M1 M1 :O, S微笑Simplified Molecular Input Line Entry Specification (微笑) 是 a 线记法 为分子。 微笑串包括连通性,但不包括第 2 或 3D 座标。氢原子没有代表。 其他原子由他们的元素标志 B、 C、N、O 、F、P、S、分类、增殖比和 I.代表。 标志“=”代表双键,并且“#”代表三键。 分支被表明
9、()。 圆环由对数字表示。有些例子是名字 惯例 微笑串甲烷 CH4 C对氨基苯甲酸二 C2H6O CCO苯 C6H6 C1=CC=CC=C1 或 c1ccccc1乙烯 C2H4 C=C其他共同性格式其中一个最宽的半新业界标准是 化工表文件 格式,象 结构数据格式 (SDF)文件。 他们是遵守一个严密的格式为代表多个化学结构纪录和伴生的数据域的文本文件。 格式由被限制的分子设计最初开发并且出版(MDL)。 MOL 是另一个文件格式从 MDL。 它在白皮书的第 4 章被提供 媒介:MDL CTfile 格式.PubChem 也有 XML 和 ASN1 文件格式,是出口选择从 PubChem 网上数
10、据库。他们是都基于的文本(ASN1 经常是一个二进制格式 )。有在桌里如下所示的很大数量的其他格式。转换在格式之间OpenBabel 并且 JOELib 自由地是具体地被设计的可利用的开放来源工具为转换在文件格式之间。 他们的化工专家系统支持大原子类型变换桌。巴比伦- i input_format input_file - o output_format output_file例如,转换在 SDF 的文件 epinephrine.sdf 成 CML 使用命令巴比伦- i sdf epinephrine.sdf - o cml epinephrine.cm l发生的文件是 epinephrine
11、.cm l。一定数量的工具为观察意欲,并且编辑分子结构能读文件以一定数量的格式和写他们在其他格式。 工具 JChemPaint (根据 化学发展成套工具), XDrawChem (基于 OpenBabel), 编钟和 Jmol 适合到这个类别里。化学制品 MIME 项目“化学制品 MIME”是一种事实上方法为增加 MIME 类型对化工小河。在化学车间期间在第一次万维网国际会议,这个项目在 1994 年5 月开始了于 1994 年 1 月和首先宣布了,举行在 CERN。 互联网草稿的第一个版本被出版了在 5 月 10 月 1994 年和第二个修证本期间在 4 月 9 月期间 1995 年。 纸在
12、 1996 年 8 月提出了对CPEP (委员会在打印的和电子出版物) 在 IUPAC 会议上为讨论是可利用的。文件扩展名 MIME 类型 固有名称 描述alc chemical/x 方术 方术格式csf chemical/x 贮藏所 csf 贮藏所 MolStruct CSFcbin, cascii, ctabchemical/x cactvs 二进制 CACTVS 格式cdx chemical/x-cdx ChemDraw 交换文件cer chemical/x-cerius MSI Cerius II 格式c3d chemical/x-chem3d Chem3D 格式chm chemica
13、l/x-chemdraw ChemDraw 文件cif chemical/xcif 晶体信息文件晶体信息框架由公布 结晶学国际联合 cmdf chemical/x-cmdf CrystalMaker 数据格式cml chemical/x-cml 化工标记语言XML 基于 化工标记语言.cpa chemical/x 指南针 Takahashi 的指南针节目bsd chemical/x 交火 交火文件csm, csml chemical/x-csml 化工样式标记语言ctx chemical/x-ctx Gasteiger 小组 CTX 文件格式cxf, cef chemical/x-cxf 化工
14、交换格式emb, emblchemical/x embl dl 核苷酸EMBL 核苷酸格式spc chemical/x 太空星群 spc SPC 格式为鬼和色谱分析的数据inp, gam,流浪儿chemical/x gamess 输入 GAMESS 输入格式fch, fchk chemical/x 高斯检查站 高斯检查站格式崽 chemical/x 高斯立方体高斯立方体(Wavefunction) Formagau, gjc, gjf chemical/x 高斯输入 高斯输入格式gcg chemical/x gcg8 序列 蛋白质序列格式gen chemical/x-genbank ToGen
15、Bank 格式istr, ist chemical/x-isostar 分子间的互作用 IsoStar 图书馆 jdx, dx chemical/x-jcamp-dx JCAMP 分光镜数据交换的格式家族 chemical/x-kinemage 运动(蛋白质结构)图象mcm chemical/x-macmolecule MacMolecule 文件格式mmd, mmod chemical/x 宏观模式输入 宏观模式分子技工mol chemical/x-mdl-molfile MDL Molfile微笑, smi chemical/x 白天微笑 被简化的分子输入线词条规格 一条线记法为分子。sd
16、f chemical/x-mdl-sdfile 结构数据文件明确的规格在 http:/www.ch.ic.ac.uk/chemime/ 哪些更新,当主要新型出现。化学制品 MIME 支持为在您的系统登记化工 MIME 类型的 Unix 或 Linux 有 tar.gz 可利用。 节目可能然后登记作为观察者、编辑或者加工者为这些格式,以便完全支持为化工MIME 类型是可利用的。化学制品笑剧数据: http:/ 文件格式 OpenBabel, JOELib, OELib 化学发展成套工具 化工标记语言 参考 白天微笑主页 白天微笑理论和细节 医学, PubChem 网上数据库国立图书馆 研究 Collaboratory 为结构 Bioinformatics,蛋白质数据库 eMolecules (由 eMolecules,公司) 纽约三维分子结构大学图书馆 MDL CTfile 格式化白皮书 外部链接 网上分子格式交换器 基于开放巴比伦 E 巴比伦 附属程序为根据开放巴比伦的网上分子格式交换器