生物信息学基本知识.doc-道客多多

资源描述

1、1. DNA: 遗传物质(遗传信息的载体) 双螺旋结构,A, C, G, T 四种基本字符的复杂文本2. 基因（Gene）：具有遗传效应的 DNA 分子片段3. 基因组(Genome)：包含细胞或生物体全套的遗传信息的全部遗传物质。人类包括细胞核基因组和线粒体基因组OR 一个物种中所有基因的整体组成 4. 人类基因组： 3.2109 bp5. HGP 的最初目标通过国际合作，用 15 年时间(19902005)至少投入 30 亿美元，构建详细的人类基因组遗传图和物理图，确定人类 DNA 的全部核苷酸序列，定位约 10 万基因，并对其它生物进行类似研究。6. HGP 的终极目标阐明人类基因组全

2、部 DNA 序列；识别基因；建立储存这些信息的数据库；开发数据分析工具；研究 HGP 实施所带来的伦理、法律和社会问题。 7. 遗传图谱（genetic map）又称连锁图谱(linkage map)，它是以具有遗传多态性（在一个遗传位点上具有一个以上的等位基因，在群体中的出现频率皆高于 1%）的遗传标记为“路标” ，以遗传学距离（在减数分裂事件中两个位点之间进行交换、重组的百分率，1%的重组率称为 1cM）为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。8. 遗传连锁图：通过计算连锁的遗传标志之间的重组频率，确定它们的相对距离，一般用厘摩（cM，即每次减数分裂的重组频率为

3、 1%）表示。9. 物理图谱（ physical map）是指有关构成基因组的全部基因的排列和间距的信息，它是通过对构成基因组的 DNA 分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。10. 转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。 11. 序列图谱: 随着遗传图谱和物理图谱的完成，测序就成为重中之重的工作。DNA 序列分析技术是一个包括制备 DNA 片段化及碱基分析、DNA 信息翻译的多阶段的过程。通过测序得到基因组的序列图谱12. 大规模测序基本策略逐个克隆法：

4、对连续克隆系中排定的 BAC 克隆逐个进行亚克隆测序并进行组装（公共领域测序计划）全基因组鸟枪法：在一定作图信息基础上，绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序，利用超级计算机进行组装（美国 Celera 公司）13. 基因识别（gene identification）是 HGP 的重要内容之一，其目的是识别全部人类的基因。基因识别包括：识别基因组编码区识别基因结构基因识别目前常采用的有二种方法：从基因组序列中识别那些转录表达的 DNA 片段从 cDNA 文库中挑取并克隆。 14. 基因组多态性（Polymorphism）: 是指在一个生物群体中，同时和经常存在两种或多种不

5、连续的变异型或基因型（genotype）或等位基因（allele），亦称遗传多态性（genetic polymorphism）或基因多态性。 15. 功能基因组学: HGP 完成后，我们将进入“ 后基因组学”(post-genomics)时代, 基因组学研究重心已开始从揭示生命的所有遗传信息转移到在分子整体水平对功能的研究上,即功能基因组学（functional genomics）功能基因组的任务是进行基因组功能注释（Genome annotation）认识基因与疾病的关系掌握基因的产物及其在生命活动中的作用16. 生物信息学：组织处理生物数据，并从数据中提取生物学新知识的学问。(生物

6、学+计算机 +信息科学)17. 生物信息学的基本概念: 广义：是指生命科学与数学、计算机学和信息科学等交汇融合所形成的一门交叉科学。该学科综合运用数学、计算机科学和生物学的各种工具对生物信息进行获取、处理、存储、分类、分析和解释，以期阐明和理解大量数据所包含的生物学意义（掌握复杂生命现象的形成模式与演化规律）狭义：应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据，也称为分子生物信息学。（molecular bioinformatics), 核心课题是从大量的序列信息中获取基因结构、功能和进化等知识。18. 数据库（Database）：统一管理的相关数据的集合数据库管理系统（da

7、tabase management system, DBMS): 对 DB 进行管理的系统软件，提供 DB 的建立、查询、更新以及各种数据控制功能数据库技术：研究数据库的结构、存储、设计、管理和应用的一门软件学科数据库系统（database system, DBS): 采用数据库技术的计算机系统数据模型 (data model): 数据库结构和语义的一种抽象。由数据库结构、数据操作系统和完整性约束三部分组成19. 序列数据库是生物信息数据库中最基本的数据库，包括核酸序列数据库和蛋白质序列数据库两类。序列数据库以核苷酸碱基顺序或氨基酸残基顺序为基本内容，其序列数据来自核酸和蛋白质序列测定，并附

8、有注释信息。注释信息包括两部分，一部分由计算机程序经过序列分析而生成，另一部分则依靠生物学家通过查阅文献资料而获得。20. GenBank : NIH 管理一个遗传序列数据库( genetic sequence database)，序列来源公开发表所有 DNA 序列. 也是国际 DNA 序列收集中心与 DDBJ、 EMBL 进行每天的数据交换。收集全世界已发表的和自行投送的核苷酸序列以及相关文献资料。为大规模的核苷酸序列数据库建立档案，以利长期保存，为国际分子生物学及相关研究提供良好的技术与知识平台21. 启动子: 真核生物中，启动子是指所有对基因转录起始有重要作用的序列真核生物的三种 RNA

9、聚合酶分别识别不同的启动子序列22. Kozak 序列：该序列是在起始密码子之前与核糖体作用的位点。在高等原核生物中其一致序列为 GCCACC（ATG），而在酵母中为 AAAAA（ATG）。它们可以用来检测 CDS 的起始。23. CpG 岛也称 HTF 岛: 是一些富含 GC 的小区域。 CpG 岛定义为 Y 值大于 0.6 并且 GC 含量大于 50%的序列区域。通常 CpG 岛出现在管家基因或者频繁表达的基因的启动子周围，在这些部位， CpG 岛具有抵抗序列甲基化作用。CpG 岛经常出现在脊椎动物基因的 5区域，其中，50%的人类基因的转录起始位点前存在 CpG 岛，因此 CpG

10、岛是发现基因的重要线索。24. 同源性检索(homology search): 通过查询 DNA 或蛋白质数据库来判断所查序列是否与已知序列相同或相似。如果所查序列是已测序基因的一部分，则就会发现相同的匹配。同源性检索的目的是判断新序列是否与已知基因在整体上的相似性。同源性检索主要是用来探寻新发现的基因功能25. 同源序列: 简单地说，是指从某一共同祖先经趋异进化而形成的不同序列。相似性(similarity)和同源性(homology)是两个完全不同的概念。26. 相似性(similarity) ：是指一种很直接的数量关系，比如部分相同或相似的百分比或其它一些合适的度量。比如说，A 序

11、列和 B 序列的相似性是 80，或者 4/5。这是个量化的关系。当然可进行自身局部比较。相似性是指序列比对过程中用来描述检测序列和目标序列之间相同 DNA 碱基或氨基酸残基顺序所占比例的高低。相似性本身的含义，并不要求与进化起源是否同一，与亲缘关系的远近、甚至于结构与功能有什么联系。当相似程度高于 50%时，比较容易推测检测序列和目标序列可能是同源序列；而当相似性程度低于 20%时，就难以确定或者根本无法确定其是否具有同源性。总之，不能把相似性和同源性混为一谈。所谓“具有 50%同源性”，或“ 这些序列高度同源”等说法，都是不确切的，应该避免使用。 27. 同源性(Homology) ：

12、指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论，属于质的判断。就是说 A 和 B 的关系上，只有是同源序列，或者非同源序列两种关系。而说 A 和 B 的同源性为 80都是不科学的。而同源又有两种不同的情况即垂直方向的(orthology)与水平方向的(paralogy) 。序列间的相似性越高的话，它们是同源序列的可能性就更高28. 直系同源的定义是： (1)在进化上起源于一个始祖基因并垂直传递(vertical descent)的同源基因； (2)分布于两种或两种以上物种的基因组； (3)功能高度保守乃至于近乎相同，甚至于其在近缘物种可以相互替换； (4)结构相似； (5)组

13、织特异性与亚细胞分布相似29. 鉴定直系同源的实际操作标准(practical criteria)为：如基因组中的 A 基因与基因组中的 A基因被认为是直系同源，则要求：(1)A的产物比任何在基因组中所发现的其它基因产物都更相似于 A 产物；(2)A与 A 的相似程度比在任何一个亲缘关系较远的基因组中的任一基因都要高；(3)A 编码的蛋白与 A编码的蛋白要从头到尾都能并排比较，即含有相似以至于相同的模序(motif)30. 旁系同源(paralogy)基因是指同一基因组( 或同系物种的基因组)中，由于始祖基因的加倍而横向(horizontal)产生的几个同源基因。直系与旁系的共性是同源，都源于

14、各自的始祖基因。其区别在于：在进化起源上，直系同源是强调在不同基因组中的垂直传递，旁系同源则是在同一基因组中的横向加倍；在功能上，直系同源要求功能高度相似，而旁系同源在定义上对功能上没有严格要求，可能相似，但也可能并不相似(尽管结构上具一定程度的相似 )，甚至于没有功能(如基因家族中的假基因) 。旁系同源的功能变异可能是横向加倍后的重排变异或进化上获得了另一功能，其功能相似也许只是机械式的相关(mechanistically related)，或非直系同源基因取代新产生的非亲缘或远缘蛋白在不同物种具有相似的功能。 31. 序列相似性比较：就是将待研究序列与 DNA 或蛋白质序列库进行比较，用于

15、确定该序列的生物属性，也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有 BLAST、FASTA 等；序列同源性分析：是将待研究序列加入到一组与之同源，但来自不同物种的序列中进行多序列同时比较，以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有 CLUSTAL 等； 32. Blast-“局部相似性基本查询工具”(Basic Local Alignment Search Tool) : 是一个序列相似性搜索的程序包，其中包含了很多个独立的程序，这些程序是根据查询的对象和数据库的不

16、同来定义的。比如说查询的序列为核酸，查询数据库亦为核酸序列数据库，那么就应该选择 blastn 程序。33. 序列对位排列（sequence alignment): 通过在序列中插入间隔（gap)的方法使所比较的序列长度达到一致. 序列对位排列的目的是寻找同源序列.34. 相似性记分（similar score) 用记分矩阵作为序列相似性测度，比较总记分值，就可以定量评价不同对位排列的效果。35. 全局排列：对序列全长进行最优化对位局部排列：指序列间的局部区域达到高度相似36. Protein-protein BLAST (blastp) ：适合具有远源进化关系的匹配序列的检索PHI- and

17、 PSI-BLAST （Patten-hit initiated and 位点特异性 BLAST）：是敏感性最高的搜索方式，当用蛋白质-蛋白质 BLAST 检索未见阳性时，可以进一步采用 PHI-/PSI-BLASTTranslated query vs. protein database (blastx) : 适合对未知读码框的新测序 DNA 序列和 EST 序列分析Protein query vs. translated database (tblastn) ：适合在 ESTs，HTG 数据库中寻找那些尚未标注的编码区Translated query vs. translated data

18、base (tblastx): 同 BLASTx 一样，适合于对错误率较高的 EST 序列的分析，同时也是新基因识别的有力工具。Search for gene expression data (GEO BLAST) ：对 The Gene Expression Omnibus（GEO）进行检索。Align two sequences (bl2seq) ：序列的两两比较。Screen for vector contamination (VecScreen) ：用于识别序列中可能来源于载体的片段，以消除公共数据库中载体序列的污染。Immunoglobin BLAST (IgBlast)：免疫球蛋

19、白序列的检索。 SNP BLAST ：单核苷酸多肽性序列检索 37. BLASTN：最常用。MEGABLAST:高度/非常相似，如物种基因组完成或了解序列基本信息Discontiguous MEGABLAST：搜索相近的序列片段比较短、且相近的序列段不连续的搜索PSI-BLSAT:位点特异性反复 BLSAT,最灵敏的 BLAST 程序，可找到蛋白质的远亲序列。先用BLAST 搜索数据库，将获得的序列通过多序列比对来构建第一个 profile。用 profile 搜索数据库后再利用搜索的结果重新构建 profile，然后用新的 profile 再次搜索数据库，如此反复直至没有新的结果产生为

20、止。PHI-BLAST：模式发现迭代 BLAST,可指定某蛋白序列片段，以这个片段为重心查询。38. Uniprot：联合蛋白质数据库. 2002 年，在 NIH 资助下，PIR、EBI 和 SIB 共同创建了联合蛋白质数据库39. 螺旋: 是蛋白质中最常见最典型含量最丰富的二级结构元件.在螺旋中，每轮卷曲的螺旋包含 3.6 氨基酸残基，残基侧链伸向外侧,同一肽链上的每个残基的酰胺氢和位于它后面的第 4 个残基上的羰基氧彼此之间形成氢键。在水环境中，肽键上的酰胺氢和羰基氧既能形成内部(-螺旋内)的氢键，也能与水分子形成氢键。不同的氨基酸对螺旋形成的影响是不同的。40. 折叠: 是通过肽链间

21、或肽段间的氢键维系。可以把它们想象为由折叠的条状纸片侧向并排而成,每条纸片可看成是一条肽链, 称为折叠股或股(strand),肽主链沿纸条形成锯齿状。需要注意的是在折叠片上的侧链都垂直于折叠片的平面,并交替的从平面上下二侧伸出。41. 无规则卷曲或称卷曲 (coil): 泛指那些不能被归入明确的二级结构如折叠片或螺旋的多肽区段。受侧链相互作用的影响很大，经常构成酶活性部位和其他蛋白质特异的功能部位如许多钙结合蛋白中结合钙离子的 EF 手结构（E-F hand structure)的中央环42. 序列模体和结构域都是通过对相关蛋白质的多序列比对分析而获得的序列模体(Motif)，较短的序列

22、模式，结构域(Domains)，相对较长的区域，通过序列谱获得的，序列模体的著名的数据库为 Prosite 数据库。43. 信号肽：某些肽链的 N-末端存在着 1530 个氨基酸的一段顺序，其功能与将此蛋白质多肽链输送到细胞的特定部位(细胞器) 有关. 真核生物信号肽平均长度 22.6 个 aa ，较长或较短的，可能是假阳性。44. 跨膜蛋白：部分或全部镶嵌在细胞膜中或内外两侧，以非极性氨基酸与脂双分子层的非极性疏水区相互作用而结合在质膜上的蛋白质。亲水部分暴露在膜的一侧或两侧表面; 疏水区同脂双分子层的疏水尾部相互作用。跨膜蛋白可再分为单次跨膜、多次跨膜、多亚基跨膜等。跨膜蛋白一般含 2

23、5%50% 的螺旋, 也有折叠。45. 计算机辅助药物设计（CADD）是以计算机技术与药物设计相结合的一门实用性的学科;为改进现有的生物活性物质的结构、设计新的药物分子，提供了理论指导和思路，加速了新药的研制。 46. 分子对接原理: 在配体和受体的相互作用过程中，牵涉到两类相互作用，即非键相互作用和共价相互作用。共价相互作用牵涉到化学键的断裂和生成，需要用量子化学的方法进行考察。而大多数药物分子和蛋白在相互作用时，一般只牵涉到非键相互作用，它们主要是分子形状匹配，静电相互作用，疏水相互作用，化学性质匹配和分子去溶剂化因素等。47. 计算机虚拟筛选技术 (Virtual Screening

24、) : 虚拟筛选的核心技术是分子对接，将数据库中的每一个小分子配体放入靶蛋白的活性口袋中，模拟真实的小分子配体和蛋白质的相互作用情形，评价结合结果的好坏。此过程类似于“锁钥 ”关系，即如何从成千上万个钥匙中找到一把能开锁的钥匙。 48. 虚拟筛选的三大要素: 靶蛋白 Targets PDB (Protein Data Bank, www.rcsb.org/pdb/) containing proteins or enzymes: X-ray crystal NMR High quality homology models 小分子 LigandsZINC database : 4.6M file

25、s provided by vendorsMDL database 对接软件 SoftwareAutodock : free for academic FlexX : commercial49. X射线衍射法(X-ray crystal): 目前能提供蛋白质三维晶体结构的重要方法,在蛋白质构象测定中，X射线衍射法能快速、精细、直观地表达出分子内各种基团的相互空间关系；50. 对接前优化: A.必须将晶体结构中大部分的水分子移除；B.给蛋白加上氢原子，进行一次能量优化；C.找出蛋白的活性口袋.51. ZINC 数据库，作为对全世界开放的免费数据库，现已有 460 万个三维结构的小分子，根据 Li

26、pinski 五原则及其它原则将数据库分成若干类：药物类似物（drug-like）, 先导化合物类似物（lead-like ）, 小分子片段（fragment-like）等，每个分子有多种分子格式： MOL2，SDF，SMILES 等，以供不同的程序应用。另外，ZINC 数据库还提供了一百多万个小分子的购买信息。52. 基于力场的评分函数: 主要是应用 Amber 力场和 CHARMM 力场等来模拟系统中原子的相互作用，包括范德华力，静电相互作用和溶剂效应等。这类评分函数的长处是分子力场曾经被深入研究过，具有雄厚的物理学专业基础；在对接时处理大分子的格点较快；缺点是仅考虑了部分的相关能，还

27、不能较好地处理：溶剂效应；熵改变导致的势能增高；静电力易被高估；排序时发生错误。53. 分子力场: 分子片段力场的函数表达式中包含自变量和力场参数;其中自变量为分子的结构参数，独立参数为键长、键角和二面角;而力场参数一般通过与实验数据和从头算数据进行最小二乘法拟合来确定。54. 经验性评分函数: 经验性评分函数有 SCORE 、Ludi 、Validate 、ChemScore 和 PLP等；优点是取样简单，计算量小，在药物设计中应用较多；得到的经验公式对不同的体系具有不同的预测能力，故具有一定的偏差。55. 基于知识的评分函数: 借用了蛋白折叠的思想，对已知的受体-配体复合物主要

28、是 X线晶体结构进行原子对距离的统计分析，对接后计算受体-配体之间所有原子间的相互作用自由能，将所有的原子间相互作用自由能进行总和，可获得受体-配体的结合自由能;基于知识的评分函数有 PMF、Bleep、SmoG 和 Drugscore 等，它们和基于经验的评分函数一样快速。基于经验的方法必须依赖于已知的蛋白-配体复合物的亲和力数据；基于知识的方法不要求蛋白-配体复合物结合亲和力数据，可以自由利用公开的可获得的信息（大约有 1000 个蛋白-配体复合物），相对于基于经验的方法，具有相对较少的偏差，而且易于推广应用到一个新的系统中。56. 一致性评分 Consensus Scoring: A.

29、虚拟筛选没有绝对的标准，每一个特殊的体系评分值都不一样;B.目前还没有哪一种评分算法对于预测真正的蛋白-配体结合方式是完美的，也就是在计算机上预测的受体-配体结合方式和以实验方式获得的蛋白-配体结合方式之间的相关性不高;C.利用一致性评分，就是将两个以上独立的评分函数联合使用;D.需要注意，在每一个特殊的体系中，评分函数的组合都有一定的适用专属性，盲目的组合评分函数并不能提高筛选的精度。 57. 虚拟筛选的本质：富集不能一对一的命中58. 虚拟筛选的策略: 蛋白分子三维结构的虚拟筛选可以有许多合理途径供选择，通常是准备好小分子的三维结构数据库，将数据库中每个小分子对接到靶蛋白，再打分排序，

30、在排序表中选取位于前列的 1%2% 的小分子进行仔细地分析，最终确定选择哪些化合物进行下一步测试。59. PCR 技术又称聚合酶链反应（Polymerase Chain Reaction）技术，是一种在体外扩增核酸的技术。该技术模拟体内天然 DNA 的复制过程。其基本原理是在模板、引物、4 种 dNTP和赖热 DNA 聚合酶存在的条件下，特异扩增位于两段已知序列之间的 DNA 区段的酶促合成反应。每一循环包括高温变性、低温退火、中温延伸三步反应。 A. 变性： 90 -96，双链 DNA 模板在热作用下，氢键断裂，形成单链 DNA。B. 退火: 55-65，系统温度降低，引物与 DNA 模板

31、结合，形成局部双链。C. 延伸: 70-75 ，在 Taq 酶（在 72左右最佳的活性）的作用下，以 dNTP 为原料，从引物的 5端3端延伸，合成与模板互补的 DNA 链。1min/Kb。D. 循环: 变性退火延伸，往复循环，即可使靶细胞序列大大扩增。E. 产物量: 从理论上讲，每循环一次，就可使产物在前一循环基础上翻 1 倍，因而使产物呈几何级增加。产物的增加符合下列公式：Y=X（1+E） nY 为产物量，X 为初始投入系统中的模板考贝数，E 为循环中的效率因子，n 为循环周期数。经过 2530 个循环后，最初的靶序列可被扩增 105109 倍。60. 耐热 DNA 聚合酶( 如 Taq

32、DNA Polgmerase) ，该酶在 7075时具有最高的酶学活性。由于它的反应温度较高，在较高温度下引物与模板的配对专一性好，从而提高了反应的特异性，这是该酶的最大优点。Taq DNA 聚合酶具有 53聚合酶活性和 53外切酶活性，但缺乏 3 5外切酶活性。因此，在 PCR 反应中如果发生某些单核苷酸的错配，这种酶是没有校正功能的,这是该酶的缺点，Taq 酶错配的概率是 2.110-4 左右。新型高保真 Taq DNA Polgmerase 可校正错配。61. 模板 : PCR 中的模板可以是来源于任何生物（包括动物、植物、细胞及病毒等）的单链 DNA 及双链 DNA。RNA 分子亦可作

33、为扩增模板, 但在作 PCR 扩增之前，需要用逆转录酶将 RNA 逆转录为 cDNA 。PCR 对模板纯度要求并不高。大量资料表明，样品中存在一定量的蛋白质或有机物对实验结果影响不大。甚至可以将细胞裂解物直接用于扩增。有 DNA 部分降解的样品，也有可能作为模板使用，但前提是样品中至少得有一个完整的靶序列分子。在 PCR 中，起始模板的用量，理论上讲可以少到仅有一个有效的单一分子。为了获得高质量和高效率扩增，模板用量可为 ng 或 ug 水平。通常用 105 个靶序列分子作为模板是比较恰当的。62. 引物长度以 1728bp 为宜。引物过短会影响到扩增的特异性，过长容易引起引物二聚体或发卡。如

34、果扩增产物500bp，引物长度为 1618bp 即可。如果扩增 45kb 的大片段，引物最好不要少于 24bp。63. 二聚体分子: 两引物分子之间或引物分子内部有过多的互补碱基，否则就会形成二聚体分子, 二聚体分子中的两条链互为模板，互为引物，引起引物扩增，导致模板扩增失败。另外，还要尽量避免引物分子内部形成二级结构（发卡）。64. 碱基分布的均衡性: 引物中应避免嘌呤或嘧啶的堆积现象，避免连续出现 4 个以上的同一碱基。各种碱基最好分布均匀，G+C 应为 50-60%。65. 引物的 Tm 值: 当温度升高到一定值后，双链 DNA 分子会解链为单链，这种温度称为解链温度。Tm 值是指溶

35、液中有半数的 DNA 分子解链为单链时的温度，推荐 55 -65 计算公式（大于 25 个碱基时，此公式不适用）：Tm=4(G+C)+2 （A+T）两条引物的 Tm 尽可能相近，最好相差不超过 3。 66. 退火温度: 高温变性的 DNA 分子在温度下降过程中，又会再度结合为双链 DNA 分子，此过程称为退火即复性。退火温度过低，少数碱基形成的局部双链不易解链，特异性降低。太高的退火温度使得引物不能复性到模板上，不能有效合成 DNA。一般将退火温度设定为 Tm 值减去515。在试验之初，人们宁可选用较低的退火温度，首先得到有 PCR 合成产物之后再逐步提高退火温度，以提高反应的特异性。67.

36、 PCR 反应管 : 对酶蛋白及核酸的吸附性应尽可能小，且要具有良好的热传导性能，有市售专供 PCR 反应用的薄壁聚乙烯管能满足上述要求。通常在 PCR 反应体系的上形成冷凝水。目前有些新型的 PCR 仪可以不用加矿物油，其机制是设计了一个特殊的可加热的热盖，从而保持了反应室温度的上下均衡而不致有冷凝水形成。P.S.1. Infoinformatics: 生物学信息EST: express sequence tag（表达序列标签）STS: sequence-tagged site （路标或序列标签位点）SNP: single nucleotide polymorphism（单核苷酸多肽性）Unigen: 单一基因CDS：编码区序列ORF: open reading frame（开放读框）/基因中翻译蛋白质的部分Intron：内含子Exon：外显子Bp：base pair（碱基对）Kb： kilobase（千碱基）Mb：megabase（兆碱基）Gb: gigabase（千兆碱基）2. PCR 万金油程序： 94预变性 5min，（94变性 45sec，55退火 45sec，72延伸1min）,35 个循环，72延伸 7min。

展开阅读全文