1、数据库资源,数据库技术及应用是计算机技术的发展给科学工作者带来的解决问题的重要手段,文献的检索、常数的查找、谱图的分析再不用去查厚厚的手册,而只需键盘的输入和鼠标的点击。因此,化学数据库的建立与应用研究在计算机化学最初发展时就成为广泛关注和重视的一个热点问题。目前,各式各样的数据库可能已经难以数清,如化学文献数据库、化学结构数据库、化学物质数据库、化学常用数据数据库等等。本节将数据库分为综合性数据库(包括多学科、多功能的大型数据库)、化学结构数据库(与化学物质结构有关的数据库)和化学参考数据库(提供化学领域常用的数据资料的数据库),对Internet上的常用数据库进行简单介绍。,综合性数据库-
2、STN系统,STN是著名的国际科学技术信息网络系统,它由三个著名的科技信息中心组成:美国化学会的化学文摘服务系统CAS、德国专业信息中心FIZ和日本科技信息中心JICST。以下分别为STN位于 CAS(http:/info.cas.org/stn.html)和FIZ(http:/www.fiz-karlsruhe.de) 的服务主页。,STN:CAS站的主页,STN:FIZ站的主页,STN主要提供科技信息在线检索服务,只要申请建立一个合法的账号,从世界各地通过网络都可以进行检索(对于没有账号的用户可利用图书馆的账号进行检索)。目前STN的数据库有200个,其目录可从上述主页上得到,其中综合性科
3、学技术数据库以及与化学有关的数据库有:,INSPEC 英国科学文摘 COMPENDEX 美国工程索引 CONF 会议预报 TA FILE 技术评价数据库 FORIS 社会科学研究情报系统 FIN 技术和自然研究情报系统 CLCOM 电子和通讯文摘 DISSABS 学位论文文摘 NTIS 美国政府研究报告 FBR 德国研究报告 JICST-E 日本科学技术情报中心数据库 SOLIS 社会科学文献数据库 CONFSCI 会议论文索引,JGRIP 日本政府研究报告 DELURA 德国航空航天数据库 SCISEARCH 科学引文索引 CA 美国化学文摘 VTB 化学工程技术文献 CJWILEY WIL
4、EY出版公司出版的化学期刊全文 CJAOAC 分析化学家联合会的化学期刊全文 CAPREVIEWS 化学文献最新文献预告 CASREACT CAS化学反应数据库 CEABA 化学工程和生物数据库 CHEMREACT 化学反应物数据库 CIN 化学工业杂记,CJVCH 应用化学全文数据库 HSDB 有害物质数据库 NISTCERAM 美国NIST结构陶瓷特性 HODOC 有机化合物数值型库 CJACS 化学期刊论文全文文档 DIPPR 化学物质物理性质数据 CJRSC 英国皇家化学协会化学期刊全文 SILICA 国际陶瓷和玻璃文献情报系统 JANAF 热化学数值数据库 ANABSTR 英国分析化
5、学文摘 CERAB 美国陶瓷文摘,CHEMSAFE 化学物质安全数值型库 CJELSEVIER 荷兰化学期刊全文数据库 EMA 工程材料文摘 ICSD 无机晶体结构数据库 RTECS 美国化学物质毒性登记 BIOSIS 生物学文摘 LHB 实验室危害通报 ULIDAT 环境文献数据库 TOXLINE 美国毒性数据库 POLLUAB 污染文献 CHI 工业界的化学公害 UFORDAT 环境研究数据库,TOXLIST 毒物法规目录 TOXLIT 毒物文献 APILIT/APILIT2 美国石油协会文献 SPECINFO NMR光谱数值结构库 MOGADOC 气相分子数据库 TRCTHERMO 热动
6、力学数值数据库 NEWCRYST 新有机无机晶体结构库,综合性数据库 -DIALOG系统,DIALOG是世界上最大的在线信息服务系统,从1972年起向世界各地的图书馆和科研单位的研究人员提供各领域的论文、新闻、会议论文等信息。DIALOG拥有500多个数据库,信息内容包括科学、技术、医学、商业、贸易等等,另外用户还可以通过DIALOG在线阅读100多种报纸及数千种杂志。其中与化学、生物化学有关的部分数据库如下:,BIOSIS PREVIEWS,生物学文摘 NTIS,美国政府研究报告文摘通报 CHEMICAL INDUSTRY NOTES,化学工业杂记 METADEX,金属文摘 ALUMINIU
7、M INDUSTRY SBSTRACTS,世界铝文摘 SCISEARCH,科学引文索引 ENVIROLINE,环境文摘 POLLUTINE ABSTRACTS,污染文摘 EMBBASE,荷兰医学文摘 INTERNATIONAL PHARMACEUTICAL ABSTRACTS,世界药学文摘 LIFE SCIENCES XOLLECTION,生命科学文摘,CONFERENCE PAPERS INDEX 会议文献索引 PASCAL,法国科学文摘 MEDLINE,美国医学索引 FEDERAL RESEARCH IN PROGRESS,美国进展中的研究项目 ANALYTICAL ABSTRACTS,分
8、析文摘 CEAMIC ABSTRACTS,陶瓷文摘 CHEMSEARCH,化学物质名称 CA SEARCH,美国化学文摘 DLALOG的服务主页地址为:http:/,综合性数据库 -Entrez系统,Entrez是由美国NCBI(National Center for Biotechnology Information)建立的一个生物、医学专业的具有综合服务功能的数据库系统。它的主页地址为: http:/www.ncbi.nlm.nih.gov/Entrez/ 利用该系统可方便地进行文献检索、生物化学物质以及它们的结构检索等。另外该系统还有一个特点是具有相互关联功能,根据检索的结构可给出相关的
9、结构链接和与该结构有关的文献链接等。,提供下列内容的查询与服务:,Nucleotides,核苷酸 Ptoteins,蛋白质 3D structures,三维结构 Genomes,基因组 Taxonomy,分类检索 Literature - PubMed,文献检索,NCBI由下列数据库构成:,PubMed database,文献数据库 Protein database,蛋白质数据库 Nucleotide database,核苷酸数据库 MMDB 3D structures database,三维结构数据库 Genomes database,基因组数据库,国内数据库资源简介,国内的数据库资源发展很
10、快,在“中国数据库(http:/)”的索引中就有254个链接,包括天文、地理、社会科学、自然科学、自然科学等各个领域的数据库,以下为与化学工作者相关的一些数据库: Chinainfo(万方数据库中心), http:/ 中国科技学院数据库,http:/,http:/159.226.2.20:1205,http:/ 中国科技信息中心数据库检索服务,http:/168.160.24.11/htbin/tripnet等,化学信息数据库,化学信息数据库的内容仅局限于与化学有关的学科知识,其中化学结构数据库在化学类数据库中占有很高的比例,是化学类数据库中较大型的数据库,如: 剑桥结构数据库(CSD) ht
11、tp:/www.ccdc.cam.ac.uk/ 布鲁克海文(Brookhaven)蛋白质数据库http:/www.pdb.bnl.gov Rutgers大学的核酸数据库http:/nbserver.rutgers.edu:80,也有范围较小的专业数据库,如: 有机化合物数据库(Organic Compounds Database) http:/WWW.colby.edu/chemistry/cmp/cmp.html 化学危险品数据库(Hazardous Chemicals Database)http:/ull.chenistry.uakron.edu/erd/ 纳米技术数据库(Nanotech
12、nology Database) http:/itri.loyola.edu/nanobase/ 生物大分子晶体结构数据库(The Biological Macromolecule Crystallization Database,BMCD) http:/ibm4.nist.gov:4400/bmcd/bmcd.html,澳大利亚蛇毒和毒素数据库(Australia Venom & Toxin Database) http:/WWW.uq.edu.au/ddbfry/ WWW化学结构数据库(The WWW Chemical Structures Database) http:/ 化合物基本性质
13、数据(CS ChemFinder) http:/ NIST的Chemistry WebBookhttp:/webbook.nist.gov/chemistry/。,1、剑桥结构数据库(CSD),剑桥结构数据库(Cambridge Structural Database,CSD)是剑桥晶体结构数据中心(Cambridge Crystallographic Data Centre,CCDC)建立的有机和金属有机化合物结构数据库。目前该数据库有180000种有机和金属有机化合物的晶体结构数据,这些数据均经过了X射线或中子衍射实验的分析。目前,以CSD为核心,CCDC提供了另外两个数据库(美国Broo
14、khaven国家实验室的Brookhaven蛋白质数据库PDB和Intostar-关于非键相互作用的数据库)共同构成了CSDS(Cambridge structural database system)系统。,CCDC的主页地址为: http:/www.ccdc.cam.ac.uk/,下图为该主页的画面。在CSD中,每一条目都由三个部分组成,分别叫做“1D information”、“2D information”和“3D information”,其中“1D information”包括文献资料和晶体结构的结构(组成)信息和实验信息,“2D information”即化合物的平面结构信息,包
15、括原子的性质、原子的联接性质、化学键信息等,而“3D information”是指建立分子的三维结构图所需要的信息,包括原子的三维坐标值、空间对称性、共价半径等。,剑桥晶体结构数据中心的主页,CSDS提供结构数据是收费服务,可直接与他们联系(depositccdc.cam.ac.uk),也可能通过他们的代理联系。CCDC在世界各地有许多代理部门,目前在中国的代理是中国科学院化工冶金研究所(http:/)。,2、布鲁克海文(Brookhaven)蛋白质数据库,Brookhaven 蛋白质数据库PDB(protein data bank)是生物大分子的三维结构数据库,它包括原子坐标、文献出处、一级
16、序列和二级结构信息、晶体结构因子以及2D-NMR实验数据,涉及的大分子包括蛋白质、DNA、RNA、病毒、碳水化合物等。该数据库的服务主页地址为:http:/www.pdb.bnl.gov,通过该主页,用户可以直接通过PDB ID CODE获得所需要的结构数据,如果不知道ID CODE,可使用搜索工具查询。该主页提供的搜索工具有:3DB Browser,PDB Lite(for beginners)以及Other Search Tools。利用这些搜索工具,用户可根据关键词、作者等方便地进行检索。在Other Search Tools页面中还提供了各种索引,用户可利用这些索引进行检索。,通过匿名
17、FTP也可能访问该数据库,将所需要的蛋白质结构数据传到用户的本地机上。当然也可以按照一定的要求将用户新测定的结构数据上载到该服务站点上。匿名FTP的地址为:pdb.pdb.bnl.gov 当连通匿名FTP服务器以后,会有许多帮助文件说明该服务器的使用方法,如contents.lis,ftphelp.txt,how2dnld.txt,how2upld.txt等。,该蛋白质数据库还有一个专门的通门的通信讨论组,讨论与该数据库有关的问题,如果加入该讨论组,可以经常得到有关信息。通信讨论组的服务器为“listservpdb.pdb.bnl.gov”,向该地址发一封内容为“subscribe PDB-L
18、 your name”的信件即可加入。 该数据库在国内有镜像服务器,位于北京大学的生物信息服务中心,服务地址为: http:/ 蛋白质数据库的服务主页,3、核酸数据库,核酸数据库(nucleic acid database)即美国Rutgers大学了的核酸晶体结构数据库,可以通过e-mail、匿名FTP、WWW和Gopher等途径访问,服务器的地址分别为: ndblibndbserver.rutgers.edu ftp:/ndbseerver.rutgers.edu http:/sbserver.rutgers.edu:80 gopher:/ndb.rutgers.edu,该数据库的使用非常方
19、便,对于不熟悉的用户处处都可以得到帮助信息。例如用FTP方式访问时,进入每一个目录后,都可得到非常详细的帮助信息,说明每个子目录的文件内容。直到进入最终的结构数据目录,从文件列表中挑选所需要的文件即可下载。下图为WWW的服务主页。,核酸数据库的WWW主页,4、化合物基本性质数据库(CS ChemFinder),CS Finder 是CambridgeSoft公司1995年11月在 Internet上推出的网络服务,通过该主页可以按化合物的分子式、英文名称、CA登录号和化学结构进行查询,得到该化合物的基本性质,包括分子结构、相对分子质量、熔点、沸点、密度、溶液度等以及该化合物的生产厂家、包装说明
20、及购买方。目前,该数据库的化合物已超过5万种。,下图为CS Finder的服务主页,它提供了多种服务,其中化合物检索可以在文字框中填写分子式、英文名称、CA登号等进行检索,也可以点击结构式检索,用鼠标画出结构式作为输入。,CS Finder的服务主页,下图为CS Finder对分子式“C4H8O2”的检索结果,共检索到37种分子式为“C4H8O2”的化合物,用鼠标点击检索结果中的每一个化合物名称即可得到该化合物的基本性质、生产厂家、包装说明及购买方法等信息。,CS Finder 对分子式C4H8O2的检索结果,5、NIST的Chemistry WebBook,Chemistry WebBook
21、是美国国家标准与技术研究院NIST基于WEB开发的物质数据库,首次发布于1996年8月。Chemistry WebBook可以看作是NIST标准数据库(Standard Reference Data)中与化学有关的数据库,目前所包括的内容有:,Formula(分子式) Molecular Number(相对分子质量) CAS Registry Number(CA登录号) Chemical Structure(化学结构,包括二维结构和/或三维结构) Other Names(其他名称) Notes/Error Report(备注与错误报告),Other Data Availble(其他数据) Ga
22、s phase thermochemistry data(气相热化学性质) Condensed phase thermochemistry data(凝聚态热力学性质) Phase change data(相变数据) Reaction thermochemistry data(反应热化学性质) Henrys Law data (Henry 定律数据) Gas phase ion energetics data(气相离子能数据) Gas Phase IR Spectrum(气相红外光谱) Mass Spectrum(质谱) UV/Visible Spectrum(紫外-可见光谱) Vibrati
23、onal and/or Electronic Spectra(振动与/或电子光谱数据),Chemistry WebBook的主页地址为:http:/webbook.nist.gov/chemistry/,下图为初始页面,点击“Search Options”后则显示所提供的检索方式,即:“General Searches”和“Physical Property Base Searches”。在“General Searches”中可以用“Formula”,“Name”,“CAS registry number”,“Author”,“Structure”进行检索,在“Physical electr
24、onic energies”中,则可以用“Ion energetics properties”, “Vibration and electronic energies”,“Molecular weight”进行检索。,NIST WebBook Chemistry 的Web 主页,例如,选择以分子式检索,输入C6H6O2”,可以得到9种同分异构体,如下图A,点击“Hydroquinone(对苯二酚)”则得到该化合物的各种性质参数,如图B。再点击所需检索的性质参数即可秘到检索的结果。图C和D分别为检索得到的对苯二酚的红外光谱图和质谱图。这些谱图还可以根据需要进行局部放大显示,图A WebBook
25、Chemistry 中C6H6O2的检索结果,图BWebBook Chemistry 中对苯二酚的性质参数,图C WebBook Chemistry 的红外光谱示例,图D WebBOOK Chemistry 的质谱图示例,6、化合物谱图数据库,结构解析是化学家的基本任务之,计算机辅助结构解析则一直是计算机化学的重要研究内容。结构解析的主要依据是UV-VIS,IR,NMR,MS四大谱图,因此如何利用计算机存储和检索化合物的谱图具有非常重要的意义。目前,在国内外的INTERNET网站上已出现了许多谱图数据库,但真正能够在科研工作中使用的还不太多。,图E为日本National Institute o
26、f Materials and Chemical Research制作SDBS有机化合物谱图库服务主页,用滚动条向下翻动出现三个链接,即:Introduction,How to use和Search Compounds/Search NMR & ms/Display Spectra,在Introduction中有对该系统的一些说明,How to use中介绍了该系统的使用方法和步骤,而最后一项为数据库的入口。,图E SDBS 有机化合物谱图库服务主页,图F为数据库的检索输入窗口,该窗口包括三种检索方法,即:(A)化合物检索,(B)NMR检索和(C)MS检索。按要求填写检索要求后用鼠标点击下面的
27、“Search”即可得到符合检索条件的化合物列表,再点击化合物名称即可得到该化合物的谱图以及该谱图的测试条件。,SDBS谱图库的检索输入窗口,上海有机化学研究所制作的红外光谱数据库于1998年12月完成,其访问地址为:http:/ irllogin.htm。该数据库目前已拥有72582张红外谱图,可以按化合物名称和分子式进行检索,得到该化合物的红外光谱、分子的二维结构以及其他一些信息。,网上化学手册,在Internet上还有一些提供常用数据的网站。严格的讲它们并不是真正的数据库,但它们可以向化学工作者提供非常重要的常用数据,对化学工作者具有十分重要的意义。,1、物理化学常数,物理化学常数是化学
28、工作者常用的数据资料,但很难把它们全部记住,去图书馆翻阅手册是常用的方法,但是不仅费时费力而且在某些情况下还是不可能的。利用网上资源是一个非常方便而又快捷的手段。以下给出几个物理化学数据资源的有关地址,可参考利用。在这些主页中除物理化学常数以外,还可以找到国际单位制的有关知识以及单位换算的有关内容。,http:/physics.nist.gov/(美国国家标准和技术研究所物理实验室主页) http:/physics.nist.gov/cuu/Constants/index.html(物理化学参数搜索或查找) http:/physics.nist.gov/cuu/Constants/links.
29、html(其他数据站点的链接) http:/www.chemie.fu-berlin.de/chemistry/general/constants_en.html http:/www-personal.umich.edu/sanders/(在constants.h中提供了包含常用物理化学参数的C语言文件),2、化学元素周期表,化学元素周期表是化学工作者经常使用的工具,英格兰Sheffield大学化学系的Mark Winter博士制作了全面而又精致的化学元素周期表,称为“WebElements”。其网址为: http:/www.shef.ac.uk/chemistry/web-elements/
30、 根据不同人的爱好和终端大小的不同,r.Mark.Winter设计了两种方式,一种称为“frameless Version”,适合于大屏幕的终端,另一种为“frames Version”,适合于小屏幕的终端,两种格式的内容完全一致。图G为“frameless Version”的“Web-elements”页面。,图G Webelements 的主页画面,图G-1 Webelements 的主页画面,在图G-1页面的周期表的元素名称上单击任何一个元素均可得到该元素的有关数据,如图H为选择了“钙(C)”元素后的显示结果。 在图H的左侧选择关于钙元素的有关选项,相关内容显示于屏幕的右侧。其中的选项包
31、括:,general index 显示所有关于钙元素的资料目录 background背景资料 Key data and description关键数据和描述,包括元素符号、名称、原子序数、相对原子质量等 History 历史资料 Calcium:the atom 钙:原子 Electronic configuration 电子构型 Ionization enthalpies 离解热(焓),Electron affinities 电子亲和力 Electronegativities 电负性 Effective nuclear charges 有效核电荷 Electron binding energ
32、ies 电子结合能 Atom radii 原子半径 Valence shell radii 共价半径 Physical properties 物理性质 Bulk properties(melting point,etc.) 堆积性能 Thermal properties(melting point,etc.) 热性质,Thermodynamic properties 热力学性质 Calcium:compounds 钙:化合物 Compounds 化合物 Bond enthalpies 键焓 Radii in compounds 化合物中的半径 Lattice energies 晶格能 Redu
33、ction potentials 还原势 Calcium around us 我们身边的钙,Uses 用途 Geology 地质 Biology 生物 Calcium:isotopes 钙:同位素 NMR 核磁共振 Naturally occurring isotopes 天然同位素 Radioisotopes 放射性同位素 Crystal structure 晶体结构 Crystal structure 晶体结构 view virtual reality world 查看虚拟真实图像 view pdb image 查看pdb图像,图H 钙元素的关键数据,通信讨论组,参加Internet通信讨
34、论组是进行广泛信息交流的又一良好途径。参加了通信讨论组以后,用户可以发布与讨论主题有关的任何消息,如会议通知、招聘消息、参考书及参考文献寻找、对某个问题的询问或建议、寻找新的软件以及询问某人的地址等等。,AMBER,Amber用户讨论组,amber-request cgl.ucsfedu ANALYSIS-L,分析科学讨论组,maiser fs4.in. uniist. ac.uk ANCHODD,药物化学和药物学讨论组,listerv cc.utas.edu.au APCJEM,天体物理化学讨论组,mailbase mailbase,ac.uk BIOTECH,生物技术讨论组,LISTSER
35、V UMDD.BITNET C2L,Cerus2用户讨论组, CCL,计算化学讨论组,OSCPOSTohstpy或OSCPOSToscunb.osc.edu,商业信息,Internet的发展为商业信息的传播同样提供了有力的手段,近年来越来越多公司在Internet上申请域名,建立站点,介绍公司的产品、进和广告宣传以及进行促销活动。同时,基于Internet的网上贸易(电子商务)网站也逐步建立起来。与化学有关的化学试剂公司、仪器齐备公司、化学软件公司等也越来越多地利用Internet工具提供公司的产品介绍、产品价格、服务内容等信息。作为用户,我们可以通过Internet对与化学工作者的有关的产品
36、进行了解。目前,很多化学试剂公司和仪器设备公司在Internet建立了服务网站,,DOW公司(The Dow Chemical Copany) http:/./homepage/index.html 杜邦(du Pont)公司 http:/ Perkin-Elmer(PE)公司 http:/www.perkin- 惠普(Hewlett Pachard)公司 http:/www.hewlett- http:/ http:/159.226.2.24/cindex.html(国家自然科学基金委) http:/ http:/chemistry.rsc.org/rsc/iupac.htm(IUPAC) http:/www.noble.se(The Noble Foundation) http:/www.nas.edu/(National Academy of Sciences,USA) http:/www.acs.org(美国化学会) http:/www.gdch.de(德国化学会),