1、 试题、答题纸 总 4 页 第 1 页 (A)卷课程类别:必修 选修 考试方式: 开卷 闭卷 _学年第 2 学期使用班级: 课程名称:Bioinformatics(生物信息学)考试时间:_ _年_ _月_ _日姓名: 班级: 学号: 一、 不定项选择题(每题 2 分,共 15 题,共 30 分)1.生物信息学时生物和信息技术的结合,它由几部分组成,包括(ABCD)A.能储存和处理大量生物数据集的数据库B.生物数据集之间关系的算法的开发C.利用生物信息学工具分析和解释各种类型的生物数据D.揭露生物数据集之间关系的统计工具的开发2.那个蛋白质结构分析方法方法不正确(D)A.X 射线晶体衍射B.核磁
2、共振 NMRC.电子显微镜D.质谱法3.以下哪个不是辅助序列数据库(A)A.SWISS-PROTB.dbESTC.dbGSSD.dbSTS4.提交序列到三个主要数据库可以使用的软件包括(ACD)A.WebinB.LinkDBC.BankItD.Sequin5.当序列有一个共同祖先序列,它们往往表现出的相似性有(BCD)A.基因组的位置B.序列C.生物学功能D.结构6.下列软件中哪个能进行蛋白质和蛋白质之间的相似性比较(B)A.BlastnB.BlastpC.BlastxD.Tblstn7.关于 PSI-BLAST,下面说法不正确的是(C)试题、答题纸 总 4 页 第 2 页 (A)卷A.PSI
3、-BLAST 可以提高 BLAST 和 FASTA 的相似序列的发现率B.PSI-BLAST 可以查询序列更多疏远相关序列C.PSI-BLAST 不存在找到不相关的序列来污染迭代搜索D PSI-BLAST 检测找到的进化关系通常能比 BLAST 的结果多出两倍8.在 PROSITE 中,LIVM-LT-ST-A-STA-H-C 序列模式表示多少个残基(D)A.14B.13C.8D.79.下列哪个数据库与蛋白质家族无关(A)A.TrEMBLB.PROSITEC.PRINTSD.BLOCKS10.许多不同类型的字符可以用于系统发育树分析,但核苷酸和蛋白质序列是最为常用的,为什么(ABC)A.他们为
4、所有生命形式所共有B.他们允许研究关系密切或疏远的类别C.他们能够客观地比较D.他们的突变率是恒定的11.下列哪些方法可以用来构建系统发育树(ABCD)A.距离矩阵法B.不加权的算术平均组对法C.最大简约法D.最大似然法12.三种不同的蛋白质结构类型包括(BCD)A.酶蛋白B.球状蛋白C.内在膜蛋白D.纤维蛋白13.关于比较模型,下列哪些说法是正确的(ABCD)A.联配过程是至关重要的B.模板结构可以通过标准序列相似性搜索方法找到C.在所有的预测方法中,比较模型是最精确的D.比较模型需要至少一条已知的蛋白质序列作为模板14.比较建模从概念上看包括(ABCD)A.保守核心残基的定位B.可变回环的
5、模型化试题、答题纸 总 4 页 第 3 页 (A)卷C.侧链的定位和优化D.模型的提炼15.蛋白质结构预测最佳的策略是(A)A.首先是比较模型,然后二级结构预测,其次是折叠识别B.首先是二级结构预测,然后比较模型,其次是折叠识别C.首先是比较模型,然后折叠识别,其次是二级结构预测D.首先是二级结构预测,然后折叠识别,其次是比较模型二、 填空题(每题 2 分,共 10 题,共 20 分)16.相似性比较就是将 待研究序列 与 DNA 或蛋白质序列库 进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。17. 两种数据搜索的方法。分别是 序列相似性搜索 和 基于文本的搜索
6、。18.序列联配是使相似度量化用来区分 偶然性的相似 和 真实的生物学关系 。19. 序列同源性分析是将待研究序列加入到一组与之同源,但来自 不同物种 的序列中进行 多序列同时比较 ,以确定该序列与其它序列间的同源性大小。20.根据 序列同源性分析 的结果,可以重建反映物种间进化关系的进化树。为完成这一工作已发展了多种软件包,象 PHYLIP 或 PAUP 等。21. GenBank 与 EMBL 及 DDBJ 三个数据库是综合性的 DNA 和 RNA 序列数据库,其数据来源于众多的研究机构和核酸测序小组,来源于科学文献。22.PDB 中含有通过实验 X 射线晶体衍射 和 核磁共振 NMR 测
7、定的生物大分子的三维结构,其中主要是蛋白质的三维结构,还包括核酸、糖类和其它复合物的三维结构。23.预测外显子的 最长 ORF 法 假定:只要找出序列中最长的 ORF(大于 300 bp)就能相当准确的预测出基因。24.研究关系密切的物种的进化关系,我们需要找到 进化足够快的分子 ,相反,如果我们想研究更多不同种类物种之间的进化关系,我们需要找到 普便存在的高度保守的分子 。25.如果两条蛋白质序列可以匹配,并且 80 个以上的残基的联配显示出 25% 以上相似度,那么他们将共有同样的基本结构。三、 判断题(每题 1 分,共 10 题,共 10 分)26、Accession numbers 用
8、 NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和 NC_xxxxxx 的形式来表示( )。27、PDB 格式中 ATOM 行以字符计数,而不是以单词计数( )。28、AceDB 是基因组数据库的普遍商定的格式( )。29、在同一类折叠蛋白质或拓扑类蛋白含或多或少相同的二级结构分子( )在同一类折叠蛋白质或拓扑类蛋白含或多或少相同的二级结构分子试题、答题纸 总 4 页 第 4 页 (A)卷30、BLAST 和 FASTA 是基于全球性的对比算法( )。31、相似性的低 P 值表明重要的匹配,这些匹配可能会有真实生物学意义。( )。32、蛋白质结构往往被保留,甚至由于进化使序列改变到不能被识别时结构仍被保留。所以结构知识是理解蛋白质进化的一个关键因素。( )。33、有很多蛋白质,其序列和结构非常相似,但功能却不相同。( )。34、更大数字的 PAM 矩阵表示更短的进化距离。( )。35、蛋白质能自发性地折叠成自己的原始结构。 ( ) 。26、()27、()28、()29、()30、()31、()32、()33、()34、()35、()