1、工业产权信息和文献手册 标准号 ST. 25 页号 3.25.1 HE032501 日期 1998.11 标准 ST.25 专利申请中核苷酸和氨基酸序列表的表述标准 1998 年 5 月 28 日 PCIPI 执行协调委员会第二十二次会议上通过的标准 建议专利局对附件 C 中 按专利合作条约 (PCT) 的国际专利申请中核苷酸和氨基酸序列表的表述标准 作必要修改后适用于非 PCT 国际申请的所有专利申请 注意对 PCT 程序特定的某些条款和要求可能不适用非 PCT 国际申请的专利申请 * 该 PCT 标准的文本复制在下文中 * 如果在 1998 年 7 月 1 日 专利局适用的国内法和实 际作
2、法与 按专利合作条约 (PCT) 的国际专利申请中核苷酸和氨基酸序列表的表述标准 第 3 段的前两句的条款不一致 那么只要这种不一致继续存在 该专利局可选择不遵循这些条款工业产权信息和文献手册 标准号 ST. 25 页号 3.25.2 HE032501 日期 1998.11 附件 C 按专利合作条约 (PCT) 的国际专利申请中核苷酸和氨基酸序列表的表述标准 引言 1. 为了使得国际专利申请中核苷酸和氨基酸序列表的表述标准化而制订了本标准 本标准的目的是使申请人制作的一个序列表能在国际阶段被所有受理局 国际检索和初步审查单位以及被在国家阶段所有指定局和选定局接受 其目的在于提高国际申请中提供的
3、核苷酸和氨 基酸序列的表述精确度和质量 使申请人 公众和审查员更容易表述和传播该序列 有利于序列数据的检索和允许电子形式的序列数据的交换以及将序列数据输入计算机数据库 定义 2. 就本标准而言 (i) 序列表 一词是指提交的申请中说明书的一部分或申请之后提交的文件 它详细公开了核苷酸和 / 或氨基酸序列和其他有用的信息 ( ii) 所包括的序列是四个或更多氨基酸的任何不分支的序列或十个或更多核苷酸的不分支的序列 本定义特别排除了分支的序列以及具有少于四个特别定义的核苷酸或氨基酸的序列以及含有列于附录 2 表 1 2 3 和 4 之外的核苷酸或氨基酸的序列 ( iii) 核苷酸 只包括那些可使用
4、附录 2 表 1 中列出的符号表示的核苷酸 对于修饰形式 例如甲基化碱基 可按附录 2 表 2 中所述进行描述 但不得在核苷酸序列中直接表示 (iv) 氨基酸 是那些通常在天然存在的蛋白质中发现且列于附录 2 表 3 中的 L - 氨基酸 本定义中不包括那些含有至少一个 D - 氨基酸的氨基酸序列 含有翻译后修饰的氨基酸的任何氨基酸序列可以使用附录 2 表 3 所示的符号按最初翻译的 氨基酸序列进行描述 其中修饰位置 例如 羟基化或糖基化 按附录 2 表 4 所述进行描述 但这些修饰不应该在氨基酸序列中直接表示 本定义包括使用附录 2 表 3 的符号 结合在别处描述 例如异常键 交联 ( 例如
5、 二硫键 ) 和末端帽结构 非肽键等的描述可作为序列表示的任何肽或蛋白质 (v) 序列标识符 是相应于指定给序列表中每个序列的 SEQ ID NO 的唯一整数 (vi) 数字标识符 是代表特定数据元的三位数字 (v ii) 中性语言词汇 是指在序列表中使用的代表序列数据库提供者所规定的科学术语的受限制词汇 ( 包括科学名称 修饰词和其受限制词汇的涵义 显示于附录 2 表 1 23 和 4 中的符号和显示于 附录 2 表 5 和 6 中的特征关键词 ) (v iii) 主管局 是对国际申请进行国际检索的国际检索单位 或对国际申请进行国际初步审查的国际初步审查单位 或起动国际申请程序前的指定 /
6、或选定局 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.3 HE032501 日期 1998.11 序列表 3. 2(i) 节定义的序列表如果与申请一起提交 应该置于申请的结尾 该部分应该以 序列表 作为标题 在新的一页上开始 并优选具有独立的页码编号 序列表构成说明书整体的一部分 因此 根据第 36 节 不必在说明书的其他地方描述序列 4. 如果 2(i) 节定义的序列表不包括在申请日时提交的申请文件中 而是在 提交申请之后完成的一份单独的文件 ( 参见第 37 节 ) 它应该以 序列表 作为标题并应具有独立的页码编号 随后完成的序列表应该保留申请时的申请文件中的序列原始编号
7、 ( 参见第 5 节 ) 5. 每个序列应该指定一个独立的序列标识符 序列标识符应该从 1 开始并以整数依次增加 如果对于一个序列标识符没有提供序列 在数字标识符 下将出现代码 000 在 SEQ ID NO 之后的下一行开始 对应于数字标识符 应该包括 SEQ ID NOs 的总数 无论其后跟随的是一个序列还是代码 000 6. 在申请的说明书 权利要求书或附图中 序列表中出现的序列应该以序列标识符表示并在前面加上 SEQ ID NO: 7. 核苷酸和氨基酸序列应该以下面三种可能的情况中的至少一种表示 (i) 纯核苷酸序列 (ii) 纯氨基酸序列 (iii) 核苷酸序列与其相应的氨基酸序列一
8、起 对于以上述选项 ( iii) 的格式公开的那些序列 该氨基酸序列必须作为具有独立的整数序列标识符的纯氨基酸序列在序列表中独立地公开 核苷酸序列 使用的符号 8. 核苷酸序列应该只用单链表示 从左到右是 5 末端到 3 末端的方向 序列中不应该表示出术语 3 和 5 9. 核苷 酸序列的碱基应该用核苷酸序列符号的单字母代码表示 只应该使用与附录 2表 1 中给出的名单一致的小写字母 10. 如果修饰的碱基是附 录 2 表 2 中列出的碱基之一 那么在序列本身中修饰的碱基应该表示为相应的未修饰碱基或表示为 n 并且应该使用附录 2 表 2 中给出的代码在序列表的特征部分进一步描述该修饰 这些代
9、码可以在说明书或序列表的特征部分使用 但不在序列本身中使用 ( 也参见第 32 节 ) 符号 n 等同于唯一的一个未知的或修饰的核苷酸 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.4 HE032501 日期 1998.11 使用的格式 11. 核苷酸序列应该以每行最多 60 个碱基排列 每 10 个碱基的组之间有一空格 12. 核苷酸序列的碱基 ( 包括内含子 ) 应该以 10 个碱基为一组分组列出 但是序列的编码部分不同 在序列的非编码部分末端 数目小于 10 个的剩余碱基应该组合起来并用空格与邻近的组分开 13. 核苷酸序列编码部分的碱基应该以三联体 ( 密码子 ) 列出
10、 14. 核苷酸的编号应该从序列的第一个碱基开始并编号为 1 在整个序列上从 5 到 3 的方向编号应该是连续的 它应该标记在右边缘的空白处 与含有碱基的单字母代码的行相邻 并给出该行最后一 个碱基的编号 上面给出的核苷酸序列的编号方法也适用于构型为环状的核苷酸序列 不同的是该序列的第一个核苷酸的指定可由申请人的选择作出 15. 由大序列的一个或多个非连续的片断或来自不同序列的片断组成的核苷酸序列应该作为带有单独的序列标识符的一个单独序列编号 具有一个或多个缺口的序列应作为具有不同序列标识符的多个单独序列进行编号 而单独序列的数目在数值上等于序列数据中连续链的数目 氨基酸序列 使用的符号 16
11、. 蛋白质或肽序列中的氨基酸应该从左到右以氨基到羧基的方向列出 氨基和羧基基团不应在序列中 表示 17. 氨基酸应该使用第一个字母大写的三字母代码表示 并应该与附录 2 表 3 给出的名单一致 含有空白或内部终止符号 ( 例如 Ter 或 * 或 . ) 的氨基酸序列可以不表示为单个氨基酸序列 但应该作为单独的氨基酸序列列出 ( 参见第 22 节 ) 18. 如果修饰的氨基酸是附录 2 表 4 中所列出的那些氨基酸之一 那么在序列本身中修饰的和异常的氨基酸应表示为相应的未修饰的氨基酸或 Xaa 但在序列表的特征部分 应使用附录 2表 4 中给出的代码进一步描述该修饰 这些代码可在说明书或序列表
12、的特征部分使用 但不能用于序 列本身 ( 也见第 32 节 ) 符号 Xaa 等同于仅有的一个未知的或修饰的氨基酸 使用的格式 19. 蛋白质或肽序列每行最多列出 16 个氨基酸 每个氨基酸之间应有一个空格 20. 将相应于核苷酸序列编码部分的密码子的氨基酸直接列于相应密码子的下方 如果一个密码子被内含子分开 氨基酸符号应列于含有两个核苷酸的密码子部分的下方 21. 氨基酸的编号始于序列的第一个氨基酸 以数字 1 表示 任选的是 成熟蛋白质前面的氨基酸 例如 前 - 序列 原 - 序列 前 - 原 - 序列和信号序列 当存在时 可用负数从与编号 1 相邻 的氨基酸开始反向编号 当氨基酸编号使用
13、负数以区分成熟蛋白质时 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.5 HE032501 日期 1998.11 不使用数字 0 在序列下方每隔 5 个氨基酸标明一次编号 氨基酸序列的上述编号方法 也适用于环状构型的氨基酸序列 不同的是该序列的第一个氨基酸的指定可由申请人作 出 22. 由大序列的一个或多个非连续的片断或来自不同序列的片断组成的氨基酸序列应该作为带有单独的序列标识符的一个单独序列编号 具有一个或多个缺口的序列应作为具有不同序列标识符的多个单独序列进行编号 而单独序列的数目在数值上等于序列数据中连续链的数目 序列表中其他有用的信息 23 . 序列表中信息项的次序应
14、遵照附录 1 中限定的数据元的数字标识符表中所列项的次序 24. 应当只使用附录 1 中限定的数据元的数字标识符表述序列表中的信息项 不能使用相应的数字标识符描述 所提供的信息应紧接数字标识符之后 而只有那些给出信息的数字标识符需要在序列表中出现 这一要求的两个例外是数字标识符 和 它们分别是 特征 和 出版物信息 的标题 并分别与数字标识符 和 的信息相关 当在序列表中在那些数字标识符的下方提供特征和出版物信息时 应分别 包括数字标识符 和 但要空着 通常 当数字标识符的第一或第二位的数字改变时 应在数字标识符之间插入一个空行 这一普遍性原则的一个例外是在数字标识符 之前不应出现空行 另外
15、任何重复的数字标识符之前应留一个空行 强制性数据元 25. 序列表中除了实际的核苷酸和 / 或氨基酸序列之外 紧接所述序列之前还应包括附录1 中所限定的下列信息项 ( 强制性的数据元 ) 申请人名称 发明名称 SEQ ID NO 的数目 SEQ ID NO x 长度 类型 生物体 序列 如果申请人的名称 ( 数字标识符 ) 由非拉丁字母表中的符号拼写 应或者纯粹音 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.6 HE032501 日期 1998.11 译或者通过翻译成英文也用拉丁字母表中的符号表示申请人的名称 对于序列表中包括的每个序列都应重复除了数字标识符 和 下的数据元以
16、外的数据元 如果对于序列标识符而言不存在序列 则只有数字标识符 和 下的数据元是强制性的 ( 见上文第 5 节和本标准的附录 3 所示例子中的 SEQ ID NO:4) 26. 除了 上文第 25 节中标出的数据元外 当序列表与有关的申请同时提交或在指定申请号之前的任一时间提交时 序列表中应包括下列数据元 案卷参考号 27. 除了上文第 25 节中标出的数据元外 当应主管局的要求或在指定申请号之后的任一时间提交序列表时 序列表中应包括下列数据元 本专利的申请号 本专利的申请日 28. 除了上文第 25 节中标出的数据元外 当提交的序列表与要求了在先申请的优先权的申请相关时 序列表中应包括下列数
17、据元 在先专利的申请号 在 先申请的申请日 29. 如果序列中使用了 n 或 Xaa 或修饰的碱基或修饰的 / 异常的 L - 氨基酸时 下列数据元是强制性的 特征 名称 / 关键词 位置 其他信息 30. 如果生物体 ( 数字标识符 ) 是 人工序列 或 未知 时 下列数据元是强制性 的 特征 其他信息 任选的数据元 31. 上文第 25 30 节中没有提到的附录 1 中限定的所有数据元都是任选的 ( 任选的数据元 ) 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.7 HE032501 日期 1998.11 特征的表述 32. 当表述序 列的特征 ( 即 数字标识符 ) 时
18、应使用附录 2 表 5 和表 6 中列出的 特征关键词 来描述它们 1 自由内容 33. 自由内容 是在数字标识符 ( 其他信息 ) 下描述序列特征的表述 这种表述不使用第 2 (vii) 节中提及的中性语言词汇表 34. 自由内容的使用应局限于理解序列所必需的一些短语 当用英语撰写时 对于每个给定的数据元而言 应不超过 4 行 每行最多 65 个字符 任何进一步的信息可用其语言包括在说明书的主要部分 35. 任何自由内容应优选使用英语 36. 如果说明书的序列 表部分含有自由内容时 任何这种自由内容应该用其语言在说明书的主要部分中重复 建议将说明书主要部分的语言中的自由内容写入称为 序列表自
19、由内容的说明书的特定部分中 随后提交的序列表 37. 未包含在申请时的申请文件中 但在随后提交的任何序列表应不超出申请时的申请文件所公开的范围 并应附具该结果的声明 这意味着在申请日之后完成的序列表应仅含有申请时申请文件中所公开的那些序列 38. 申请时申请文件中未包含的任何序列表不构成申请文件的一部分 然而 可以适用 PCT 实施细则第 13 条之三 26.3 和 91 条 以及 PCT 条约第 34 条的规定 以便可以遵照适用的条款 对申请时申请文件中所含的序列表按 PCT 实施细则第 13 条之三或第26.3 条进行改正 按 PCT 实施细则第 91 条进行更正 ( 存在明显错误的情况下
20、 ) 或按 PCT条约第 34 条进行修改 或者按 PCT 条约第 34 条作为对申请文件的修改而提交序列表 序列表的可机读形式 39. 除了申请文件中含有的序列表外 每当主管局需要时 还应以可机读形式提交序列表的副本 40. 除了书面形式的序列表外以可机读形式提交的任何序列表应与书面形式的序列表相同 并应附具 可机读形式 中记录的信息与书面形式的序列表相同 的声明 41. 序列表的整个可打印副本应包含在优选单个磁盘或能被主管局接受的任何其他电子介质上的一个电子文件内 记录在磁盘或能被主管局接受的任何其他电子介质上的文件应使 1 这些表含有 DDBJ/EMBL/GenBank 特征表 ( 核苷
21、酸序列 ) 和 SWISS PROT 特征表 ( 氨基酸序列 ) 中的摘录 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.8 HE032501 日期 1998.11 用 IBM 2 电码本 437 IBM 电码本 932 3 或可兼容的电码本来编码 例如日语 汉语 西里尔语 阿拉伯语 希腊语或希伯来语字符所需的可兼容的电码本是将罗马字母和数字指定到与特定 的电码本相同的十六进位的电码本 42. 可机读形式应优选通过诸如 PatentIn 的赠送软件或其他定做的计算机程序制作 可机读形式可以通过任何方式制作 前提是所提交的磁盘上或能被主管局接受的任何其他电子介质上的序列表在主管局
22、可接受的个人计算机操作系统中可读 43. 当使用磁盘介质时 文件的压缩是允许的 前提是压缩文件以一种在主管局可接受的个人计算机操作系统中将解压缩的自我释放格式 44. 磁盘或能被主管局接受的任何其他电子介质应具有永久贴在其上的标签 标签上应以印刷体大写字母手写或打字标明申请人姓名 发明名称 参考号 数据记录的日期 计算机操作系统和主管局的名称 45. 如果在申请日之后提交磁盘或能被主管局接受的任何其他电子介质 标签还应包含该申请的申请日和申请号 46. 按 PCT 实施细则第 13 条之三 .1(a)(i) 或 26.3 提交的书面形式的序列表的任何改正按 PCT 实施细则第 91 条提交的书
23、面形式的序列表中明显错误的任何更正或包括书面形式的序列表并按 PCT 条约第 34 条提交的任何修改应该附具包括任何该改正 更正或修改的序列表的可机读形式 下接附录 1 3 2 IBM 是美 国国际商用机器有限公司的注册商标 3 该具体电码本事实上是个人计算机的标准 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.9 HE032501 日期 1998.11 附 录 附录 1 数字标识符 附录 2 核苷酸和氨基酸符号和特征表 表 1 核苷酸表 表 2 修饰的核苷酸表 表 3 氨基酸表 表 4 修饰的和异常的氨基酸表 表 5 与核苷酸序列相关的特征关键词表 表 6 与蛋白质序列相关的
24、特征关键词表 附录 3 序列表样本 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.10 HE032501 日期 1998.11 附录 1 数字标识符 申请中提交的序列表只可以使用下文所定义的数字标识符 序列表中不应包括下文给出的数据元标题的正文 用符号 M 标示出强制性数据元 即所有序列表中都必须包括的数据元的数字标识符 ( 参见本标准的第 25 节 110 120 160 210 211 212 213 和 400 条 ) 和本标准特指的情况中必须包括的数据元的数字标识符 ( 参见本标准的第 26 27 28 29 和 30 节 130 140141 150 和 151 以及
25、 220 至 223 条 ) 用符号 O 标示出非强制性数据元的数字标识符 ( 参见本标准的第 31 节 ) 数字标识符 数字标识符说明 强制性的 (M) 或 非强制性的 (O) 注 释 申请人的名称 M 如果用非拉丁字母的 符号书写申请人的名称也应当作为纯粹的音译或翻译成英语用拉丁字母的符号表示申请人的名称 发明名称 M 案卷参考号 M 本标准的第 26节特指的情况 参见本标准的第 26 节 本专利的申请号 M 本标准的第 27节特指的情况 参见本标准的第 27 节 应该按照下面的次序用根据 WIPO 标准 ST.3 指出的双字母代码和申请号 ( 以本专利申请递交的工业产权局使用的形式 )
26、或对于国际申请 采用国际申请号标识本专利的申请号 本专利的申请日 M 本标准的第 27节特指的情况 参见本 标准的第 27 节 应该根据 WIPO 标准ST.2(CCYY MM DD) 表示日期 在先专利的申请号 M 本标准的第 28节特指的情况 参见本标准的第 28 节 按照下面的次序 用根据 WIPO 标准 ST.3 指出的双字母代码和申请号 ( 以早先专利申请递交的工业产权局使用的形式 ) 或对于国际申请 采用国际申请号标识早先专利的申请号 在先专利的申请日 M 本标准的第 28节特指的情况 参见本标准的第 28 节 应该根据 WIPO 标准ST.2(CCYY MM DD) 表示日期 S
27、EQ ID NO 的数目 M 软件 O SEQ ID NO:x 的信息 M 它应该是描述所显示的 SEQ ID NO 的整数 长度 M 以碱基对或氨基酸数目表示的序列长度 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.11 HE032501 日期 1998.11 附录 1 第 2 页 数字标识符 数字标识符说明 强制性的 (M) 或 非强制性的 (O) 注 释 类型 M 在 SEQ ID NO:x 中排序的分子类型 是 DNARNA 或 PRT 如果核苷酸序列含有 DNA 和 RNA片段 该涵义应该是 DNA 另外 DNA/RNA的结合分子将进一步在 至 特征部分描 述 生物体
28、 M 属种 ( 即 科学命名 ) 或 人工序列 或 未知 特征 M 本标准的第 29和 30 节特指的情况 空白 参见本标准的第 29 和 30 节 表述 SEQ ID NO:x 的序列中具有生物学意义的特点 ( 可以根据指出的特征数重复 ) 名称 / 关键词 M 本标准的第 29节特指的情况 参见本标准的第 29 节 只应该使用附录 2 的表 5 或 6 中叙述的那些关键词 位置 M 本标准的第 29节特指的情况 参见本标准的第 29 节 - 从 ( 特征中的第一个碱基 / 氨基酸的编 号 ) - 到 ( 特征中的 最后一个碱基 / 氨基酸的编号 ) - 碱基对 ( 编号指核苷酸序列中碱基对
29、的位置 ) - 氨基酸 ( 编号指氨基酸序列中氨基酸残基的位置 ) - 特征是否位于序列表中提交的序列的互补链 其他信息 M 本标准的第 29和 30 节特指的情况 参见本标准的第 29 和 30 节 使用中性语言词汇 或自由内容 ( 优选为英语 ) 的任何其他相关信息 任何自由内容将以其语言在说明书的主要部分重复 ( 参见本标准的第 36 节 )其中在附录 2 表 2 和 4 中出现的任何修饰的碱基或修饰的 / 特殊的 L - 氨基酸位于序列中应该使用与附录 2 表 2 和 4 中的碱基或氨基酸相关的 符号 出版物信息 O 空白 重复各个相关出版物部分 作者 O 题目 O 出版物的题目 杂志
30、名称 O 公开资料的杂志名称 卷号 O 公开资料的杂志卷号 出版号 O 公开资料的杂志出版号 页码 O 公开资料的杂志页码 出版日期 O 公开资料的杂志出版日期 如果可能 应该根据 WIPO 标准 ST.2 (CCYY MM DD) 标出日期 数据库登记号 O 由包括数据库名称的数据库指定登记号 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.12 HE032501 日期 1998.11 附录 1 第 3 页 数字标识符 数字标识符说明 强制性的 (M) 或 非强制性的 (O) 注 释 录入数据库的日期 O 录入数据库的日期 应该按照 WIPO 标准ST.2(CCYY MM DD
31、) 标出日期 专利文件号 O 文件号 只用于专利类型的引证 应该按照下列次序具体指定整个文件 根据 WIPO 标准ST.3 所示的双字母代码 根据 WIPO 标准 ST.6所示的公开号 和根据 WIPO 标准 ST.16 所示的文件类型代码 专利申请日 O 文件递交日期 只用于专利类型引证 应该根据 WIPO 标准 ST.2(CCYY MM DD) 标出日期 专利公开日 O 文件公开日期 只用于专利类型引证 应该根据 WIPO 标准 ST.2(CCYY MM DD) 标出日期 SEQ ID NO:x 中的相关残基 从 到 O 序列 M SEQ ID NO:x 应该紧随数字标识符之后 并应该出现
32、在序列上方的那一行上 ( 参见附录 3) 下接附录 2 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.13 HE032501 日期 1998.11 附录 2 核苷酸和氨基酸符号和特征表 表 1 核苷酸表 符 号 含 义 名称的来源 a a 腺嘌呤 g g 鸟嘌呤 c c 胞嘧啶 t t 胸腺嘧啶 u u 尿嘧啶 r g 或 a 嘌呤 y t/u 或 c 嘧啶 m a 或 c 氨基 k g 或 t/u 酮基 s g 或 c 强的相互作用 3H - 键 w a 或 t/u 弱的相互作用 2H - 键 b g 或 c 或 t/u 非 a d a 或 g 或 t/u 非 c h a 或
33、 c 或 t/u 非 g v a 或 g 或 c 非 t, 非 u n a 或 g 或 c 或 t/u 未知 或其他 任何 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.14 HE032501 日期 1998.11 附录 2 第 2 页 表 2 修饰的核苷酸表 符 号 含 义 ac4c 4 - 乙酰胞苷 chm5u 5 - ( 羧羟甲基 ) 尿苷 cm 2 - O - 甲基胞苷 cmnm5s2u 5 - 羧甲基氨甲基 - 2 - 硫代尿苷 cmnm5u 5 - 羧甲基氨甲基尿苷 d 二氢尿苷 fm 2 - O - 甲基假尿苷 gal q D - 半乳糖 Q 核苷 gm 2 -
34、O - 甲基鸟苷 i 肌苷 i6a N6 - 异戊烯基腺苷 m1 a 1 - 甲基腺苷 m1 f 1 - 甲基假尿苷 m1 g 1 - 甲基鸟苷 m1 i 1 - 甲基肌苷 m22g 2 , 2 - 二甲基鸟苷 m2a 2 - 甲基腺苷 m2g 2 - 甲基鸟苷 m3c 3 - 甲基胞苷 m5c 5 - 甲基胞苷 m6a N6 - 甲基腺苷 m7g 7 - 甲基鸟苷 mam5u 5 - 甲基氨基甲基尿苷 mam5s2u 5 - 甲氧基氨基甲基 - 2 - 硫代尿苷 man q D - 甘露糖 Q 核苷 mcm5s2u 5 - 甲氧基羰基甲基 - 2 - 硫代尿苷 mcm5u 5 - 甲氧基羰基
35、甲基尿苷 mo5u 5 - 甲氧基尿苷 ms2i6a 2 - 硫代甲基 - N6 - 异戊烯基腺苷 ms2t6a N - ( 9 - - D - 呋喃核糖基 - 2 - 硫代甲基嘌呤 - 6 - 基 ) 氨基甲酰 ) 苏氨 酸 mt6a N - ( 9 - - D - 呋喃核糖嘌呤 - 6 - 基 ) N - 甲基氨基甲酰 ) 苏氨酸 mv 尿苷 - 5 - 氧化乙酸 - 甲基酯 o5u 尿苷 - 5 - 氧化乙酸 osyw wybutoxosine p 假尿苷 q Q 核 苷 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.15 HE032501 日期 1998.11 附录 2
36、 第 3 页 符 号 含 义 s2c 2 - 硫代胞苷 s2t 5 - 甲基 - 2 硫代尿苷 s2u 2 - 硫代尿苷 s4u 4 - 硫代尿苷 t 5 - 甲基尿苷 t6a N - ( 9 - - D - 呋喃核糖嘌呤 - 6 - 基 ) - 氨基甲酰 ) 苏氨酸 tm 2 - O - 甲基 - 5 - 甲基尿苷 um 2 - O - 甲基尿苷 yw Wybutosine x 3 - ( 3 - 氨基 - 3 - 羧基 - 丙基 ) 尿苷 ( acp3 ) u 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.16 HE032501 日期 1998.11 附录 2 第 4 页
37、表 3 氨 基酸表 符 号 含 义 Ala 丙氨酸 Cys 半胱氨酸 Asp 天冬氨酸 Glu 谷氨酸 Phe 苯丙氨酸 Gly 甘氨酸 His 组氨酸 Ile 异亮氨酸 Lys 赖氨酸 Leu 亮氨酸 Met 甲硫氨酸 Asn 天冬酰胺 Pro 脯氨酸 Gln 谷氨酰胺 Arg 精氨酸 Ser 丝氨酸 Thr 苏氨酸 Val 缬氨酸 Trp 色氨酸 Tyr 酪氨酸 Asx 天冬氨酸或天冬酰胺 Glx 谷氨酸或谷氨酰胺 Xaa 未知或其他 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.17 HE032501 日期 1998.11 附录 2 第 5 页 表 4 修饰的和不常用的氨
38、基酸表 符 号 含 义 Aad 2 - 氨基己二酸 bAad 3 - 氨基己二酸 bAla - 丙氨酸 - 氨基丙酸 Abu 2 - 氨基丁酸 4Abu 4 - 氨基丁酸 哌啶酸 Acp 6 - 氨基己酸 Ahe 2 - 氨基庚酸 Aib 2 - 氨基异丁酸 bAib 3 - 氨基异丁酸 Apm 2 - 氨基庚二酸 Dbu 2 4 二氨基丁酸 Des 赖氨素 Dpm 2 2 - 二氨基庚二酸 Dpr 2 3 - 二氨基丙 酸 EtGly N - 乙基甘氨酸 EtAsn N - 乙基天冬酰胺 Hyl 羟基赖氨酸 aHyl 别 - 羟基赖氨酸 3Hyp 3 - 羟基脯氨酸 4Hyp 4 - 羟基脯
39、氨酸 Ide 异赖氨素 AIle 别 - 异亮氨酸 MeGly N - 甲基甘氨酸 肌氨酸 MeIle N - 甲基异亮氨酸 MeLys 6 - N - 甲基赖氨酸 MeVal N - 甲基缬氨酸 Nva 正缬氨酸 Nle 正亮氨酸 Orn 鸟氨酸 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.18 HE032501 日期 1998.11 附录 2 第 6 页 表 5 与核苷酸序列相 关的特征关键词表 关键词 说 明 allele 相关个体或株系含有相同基因的稳定的其他形式 , 该形式区别于这一位置所呈现的序列 ( 和或许其他序列 ) a ttenuator (1) 存在转录终
40、止调节的 DNA 区域 , 它控制一些细菌操纵子的表达 ; (2) 位于启动子和第一个结构基因之间 导致转录部分终止的序列区 段 C_region 免疫球蛋白轻链和重链 , 以及 T - 细胞受体 和 链的恒定区 根据链的不同可包括一个或多个外显子 CAAT_signal CAAT 盒 ; 位于可能参与 RNA 聚合酶结合的真核生物转录单位的起始点上游约 75bp 处的保守序列部分 共有序列 =GG(C 或 T)CAATCT CDS 编码序列 ; 对应于蛋白质中的氨基酸序列的核苷酸序列 ( 位置包括终止密码子 ); 特征包括氨基酸概念上的翻译 c onflict 在这一位点或区域 , 单独测定
41、的 相同 序列有所不同 D - loop 置换环 线粒体 DNA 内的一个区域 , 其中 RNA 的一段短序列与 DNA 的一条链配对 , 置换了这一区域的原始配对 DNA 链 ; 也用于描述在 RecA蛋白催化的反应中 侵入的单链置换双链 DNA 的一条链的区域 D - segment 免疫球蛋白重链和 T - 细胞受体 链 的多变区 e nhancer 顺式 - 作用序列 , 它增强了 ( 一些 ) 真核生物启动子的作用 , 并能在任一方向和与启动子相关的任何位置处 ( 上游或下游 ) 起作用 e xon 编码剪接 mRNA 部分的基因组区域 ; 可以含有 5UTR, 所有 CDS, 和
42、3UTR GC_signal GC 盒 ; 位于真核生物转录单位起始点上游的保守的富含 GC 区域 , 可以以多副本或任一方向存在 ; 共有序列 =GGGCGG gene 鉴定为基因的具有生物学意义的区域 , 并已被指定名称 iDNA 间插 DNA; 通过几种重组中的任何一种能被消除的 DNA int ron 被转录的 DNA 区段 , 但通过同时剪接位于其两侧的序列 ( 外显子 ) 即可从转录本内部将其除去 J_segment 免疫球蛋白轻链和重链 , 以及 T - 细胞受体 和 链的连接区段 LTR 长的末端重复 , 在确定序列的两端直接重复的序列 , 其类型典型地见于逆转录病毒中 mat
43、_peptide 成熟的肽或蛋白质的编码序列 ; 翻译后修饰之后成熟的或最终的肽或蛋白质产物的编码序列 ; 位置不包括终止密码子 ( 与相应的 CDS 不同 ) misc_binding 不能用任何其他 Binding 关键词 (primer_bind 或 pr otein_bind) 表述的与另一个组成成分共价或非 - 共价结合的核酸中的位点 misc_difference 特征序列与记载中存在的有所不同 , 并且不能用任何其他 D ifference关键词 (conflict,unsure, old_sequence, mutation,variation, allele 或 modifi
44、ed_base) 表述 misc_feature 不能用任何其他的特征关键词表述的具有生物学意义的区域 ; 新的或少见的特征 工业产权信息和文献手册 标准号 ST. 25 页号 3.25.19 HE032501 日期 1998.11 附录 2 第 7 页 关键词 说 明 misc_recomb 任 何一般性的 , 位点特异性的或可再现的重组事件的位点 , 该位点中 有不能用其他重组关键词 (iDNA 和 virion) 或来源关键词的修饰词( /insertion_seq, /transposon, /proviral) 表述的双螺旋 DNA 的断裂和愈合 misc_RNA 不能用其他 RNA 关键词 ( prim_transcript, precu rsor_ RNA,mRNA, 5clip,3clip,5UTR,3UTR,exon,CDS,sig _ peptide,transit _ pep -tide,mat_peptide,i ntron,polyA_site,rRNA,tRNA,scRNA 和 snRNA)限定的任何转录本或 RNA 产物 misc_signal 含有控制或改变基因功能或表达之信号的任何区域 , 所述信号不能用其他 Signal 关键词 (promoter,CAAT_ signal,TATA_signal