1、中 国 医 学 科 学 院 学 报!“#! !“!$%99FD64F0-6FE0如 何 命 名 和 书 写 基 因 最 新 国 际 人 类 基 因 命 名 和 书 写 规 则方 福 德*, 向 若 兰 , 杨 燕 丽( 中 国 医 学 科 学 院 中 国 协 和 医 科 大 学 基 础 医 学 研 究 所 医 学 分 子 生 物 学 国 家 重 点 实 验 室 , 北 京 :9999IJ=99) 基 因 符 号 应由 拉 丁 字 母 或 其 与 阿 拉 伯 数 字 组 合 而 成 ; ( P) 基 因符 号 不 应 含 标 点 符 号 ; ( ) 具 有 足 够 的 结 构 、 功 能 和表
2、达 数 据 的 克 隆 $(! 片 段 , 如 ,-./( 细 胞 色 素 “氧 化 酶 亚 单 位 !? E6+E7,+- “ +Z214.- .5D5026 !) 。/01 “#$%8 片 段 , 如 ,!+-( $%7,8 链 上 发 现 的 内 部 转录 物 : 要 注 明 所 对 应 的 基 因 和 内 部 转 录 物 , 如1.%)!-+“ 8)7%!T(%0.%!:*0)D 综 合 征 , 8)7%!T(%0.%!:*0)D/D%0(.E” , *81*+“ 艾 杜 糖 醛 酸 3! 硫 酸 酯 酶 ( T*% 蛋 白偶 联 受 体 基 因 成 员 , (6$) ; 9$%()!
3、? 确 认 了 这 个 基 因 家 族的 一 系 列 名 字 后 , 它 的 等 级 顺 序 没 有 必 要 反 映 其 在文 献 上 出 现 的 年 代 顺 序 。 由 /;? 确 认 的 这 一 系 列名 字 在 文 献 中 优 先 使 用 , 虽 然 在 相 关 的 科 学 领 域 中还 会 继 续 讨 论 对 这 个 基 因 的 命 名 。许 多 基 因 已 经 有 被 认 可 的 符 号 和 名 字 , 但 其 并不 能 反 映 后 来 增 加 的 新 信 息 。 尽 管 如 此 , 也 不 能 随意 改 变 基 因 的 名 字 , 除 非 原 先 的 命 名 存 在 严 重 的 错
4、误 。 然 而 , 一 些 研 究 某 些 特 殊 基 因 家 族 的 研 究 小 组经 常 在 发 现 了 更 多 信 息 后 共 同 修 改 了 这 些 基 因 的 名字 , 这 样 的 行 为 还 是 可 取 的 。 那 些 准 备 这 样 做 的 研究 组 应 在 /;? 上 注 册 , 这 样 可 以 避 免 某 些 可 能 出现 的 问 题 。 那 些 已 经 被 弃 用 的 名 称 应 该 尽 可 能 的 不要 再 使 用 , 否 则 会 严 重 干 扰 修 改 后 名 称 的 使 用 。如 果 一 个 基 因 仅 仅 是 因 为 与 某 个 已 知 基 因 在 结构 上 同 源
5、 而 确 认 , 而 这 个 基 因 家 族 又 是 以 功 能 来 命名 , 那 么 这 个 家 族 的 新 成 员 在 其 功 能 被 实 验 证 实 以前 都 应 安 排 一 个 工 作 的 名 称 。 可 以 用 一 个 小 写 字 母做 后 缀 来 表 示 这 个 暂 时 的 名 称 , 如 9!2:;( 白 介 素*A 工 作 名 字 ) 。匿 名 家 族 !,$-$.-/* %52!;5- *3,() :7 325/02/0” 。这 个 基 因 名 字 不 应 当 倒 写 。反 向 链 !344+%;A 0B1)0/04 82)32/;304 “#” 。相 关 ( 相 似 ) 序
6、 列 95#80(# !8过 去 人 们 曾 经 使 用 加 后 缀 “ C D;5A)(1-5;52!;5#$#%1 假 基 因 是 一 些 与 已 确 定的 某 些 基 因 高 度 同 源 的 基 因 , 但 它 们 自 身 既 不 转 录又 不 翻 译 。 最 近 在 不 同 的 器 官 或 组 织 中 发 现 它 们 也有 某 些 功 能 。 因 此 , 以 前 在 功 能 基 因 的 后 面 加 上“ O” 和 序 号 的 命 名 方 式 只 适 用 于 某 些 个 别 情 况 。 将来 , 假 基 因 可 以 在 相 似 基 因 名 字 后 面 加 上 序 号 , 如果 需 要 的
7、 话 还 可 以 加 上 “ O” 做 后 缀 来 表 示 假 基 因 ( 在某 些 特 殊 情 况 下 还 可 以 加 “ O9” ) 。 如 , 78%3#“9“ 嗅觉 受 体 , 家 族 P, 亚 家 族 Q, 第 %: 号 假 基 因 , (;*3,()A)0,01()7 *3.5;A P7 /8G*3.5;A Q7 .0.G0) %: 1/084(!6020” 。 无 论 如 何 , 假 基 因 这 个 名 称 还 将 继 续 保 留 。从 序 列 信 息 中 可 以 推 测 出 某 些 潜 在 的 假 基 因 ,如 果 这 个 基 因 至 少 有 PJR的 预 测 氨 基 酸 与
8、已 知 基 因的 开 放 读 码 框 有 超 过 PJR的 同 源 性 , 通 常 也 应 该 给其 命 名 。 ( 命 名 的 规 则 参 考 人 类 基 因 命 名 注 释 : 号 工作 组 -1S=T/3260)T3,T83.30E ” ( -1S! ,3T0B13/AT()6!02NA.0!) 。基 因 编 码 的 血 浆 蛋 白 , 血 色 素 , 还 有 一 些 特 殊 蛋 白 的命 名 必 须 要 依 据 其 委 员 会 推 荐 的 标 准 名 字 , 如 30#“ 血 色 素 , 3;1-3 %, -0.(6;(G527 3;1-3 %” 。临 床 疾 患 ( B83/53)
9、用 0( 来 表 示 。 当 基 因 的 产 物 或如 何 命 名 和 书 写 基 因“#$%5 +;L%:L%3 8=I$L%4催 化 的 20KIK7XIL04Y 末 端 样 2Y I$+L%K7!7LQ$4染 色 体 ! 关 键 区 域 206=+=N=+$!0LIL0K7 $3L=%4染 色 体 开 放 阅 读 框 206=+=N=+$ =8$% $K:L%3 WK+$4包 含 的 结 构 域 2:=+KL% 0=%IKL%L%34序 列 相 似 的 家 族 2WK+L7X LI=4- 末 端 样 2- I$+L%K7!7LQ$4相 互 作 用 的 蛋 白 2L%I$K0IL%3 8=
10、I$L%4内 含 子 转 录 本 2L%I=%L0 IK%N0L8I4配 体 27L3K%:4类 似 , =X3=NLIX4线 粒 体 的 2+LI=06=%:LK74反 向 链 2=88=NLI$ NIK%:4重 叠 转 录 本 2=Z$7K88L%3 IK%N0L8I4假 基 因 28N$M:=3$%$4数 量 性 状 2_MK%ILIKILZ$ IKLI4受 体 2$0$8I=4调 节 子 2$3M7KI=4染 色 体 区 域 内 的 基 因 簇 23$%$ 07MNI$ L% 06=+=N=+K7 $3L=%4基 因 家 族 23$%$ WK+L7X4字 符 含 义如 何 命 名 和 书 写 基 因“#$%?8435? 建 立 的 基 于 字 母 的 不 同 种 属 编码 。 这 可 以 在 C?5 找 到 , 网 址 是 !“#$!%&(#)*+&,!,-.S/.0!*#,2.*“, 常 用 的 种 属 代 码 在 附 录 W 的 表W 中 列 出 。 这 些 代 码 只 在 发 表 的 论 文 中 应 用 , 但 不 能作 为 基 因 符 号 的 一 部 分 使 用 。 种 属 名 称 以 前 缀 的形 式 加 在 基 因 符 号 前 面 括 号 内 。 例 如 , 9CB!HH#+H)2RD“/0 “#$%&%()* +,-