1、Research Papers 研究报告生物化学与生物物理进展Progress in Biochemistry and Biophysics2014, 41(5): 固有无序蛋白与蛋白质相互作用位点残基特征分析 *董 川 1) 曹赞霞 1, 2) 赵立岭 1, 2) 索振鹏 1) 王吉华 1, 2)*(1) 德州学院物理与电子信息学院, 德州 253023; 2) 山东省功能大分子生物物理重点实验室(德州学院),德州 253023)摘要 本文对固有无序蛋白(IDPs)与其他蛋白质相互作用位点残基特征进行了研究首先在数据库中选出满足条件的 109 条 IDPs 蛋白质链及与其他配体蛋白形成的 2
2、99 个 IDPs- 蛋白质复合物,然后提取复合物中作为相互作用位点的 IDPs- 蛋白质残 基这 109 条 IDPs 链中共含有 50 031 个氨基酸残基,其中处于作用位点的残基有 4 822 个通过分析发现,20 种氨基酸在 形成 IDPs- 蛋白质相互作用位点残基时具有不同的倾向性,根据形成作用位点残基的倾向性,20 种氨基酸可分成三大类:倾 向 型 氨 基 酸 (ILE、 LEU、 ARG、 PHE、 TYR、 MET、 TRP)、 中 间 型 氨 基 酸 (GLN、 GLU、 THR、 LYS、 VAL、 ASP、 HIS)、 非 倾 向 型 氨 基 酸 (PRO、 SER、 G
3、LY、 ALA、 ASN、 CYS) 研 究 结 果 还 进 一 步 表 明 , 不 同 氨 基 酸 在 有 序 区 域 与 无 序 区 域 形 成 IDPs- 蛋 白 质 作 用 位 点 残 基 的 倾 向 性 不 同 其 中 , 氨 基 酸 TRP、LEU、ILE、CYS 在 有 序 和 无 序 区 域 形 成 作 用 位 点 残 基 的 差 异性尤为明显,而氨基酸 GLU、 PHE、HIS、ALA 则基本没有多大差别 对 IDPs- 蛋白质相互作用位点残基理化特征进行分 析发现:疏水性强、侧链净电荷量较少、极性较小、溶剂可及性表面积较大、侧链体积较大、极化率较大的氨基酸比较倾向 于形成作
4、用位点残基主成分分析结果显示,残基的极化率、侧链体积和溶剂可及表面积对作用位点残基影响最大关键词 固有无序蛋白(IDPs),作用位点残基特征,有序区,无序区,氨基酸的理化性质学科分类号 Q615,Q7 DOI: 10.3724/SP.J.1206.2013.00214蛋 白 质 的 变 性 理 论 在 20 世 纪 二 三 十 年 代 被 提 出 , 随 后 Linderstrom-Lang 提 出 了 蛋 白 质 的 一 级 结 构、二级结构、三级结构学说,在此基础上提出了 蛋白质的序列决定结构、结构决定功能的假说随 后 , 这 一 假 说 得 到 了 实 验 的 证 实 然 而 , 20
5、世 纪90 年 代 发 现 的 固 有 无 序 蛋 白 质 (intrinsically disordered protein, IDPs)或 称 为 天 然 无 折 叠 蛋 白 质 (natively unfolded protein, NUP)却 打 破 了 “序 列 - 结构 - 功 能 ”的 金 科 玉 律 1-2IDPs 是 一 类 与 以 往 的 传 统 蛋 白 质 不 同 类 型 的 蛋白质这类蛋白质在天然孤立状态下,完全没有 稳 定 的 三 维 结 构 3-6, 称 为 完 全 无 序 蛋 白 ; 或 者 部 分区域没有稳定的结构,称为部分无序蛋白,相应 的 区 域 称 为 无
6、 序 区 (intrinsically disordered regions), 有稳定结构的区域称为有序区(ordered regions)由 于 IDPs 无 序 区 域 的 氨 基 酸 残 基 有 较 低 的 疏 水 性 以 及较大的静电排斥作用,这导致了无序区呈现一种 松 散 的 状 态 当 IDPs 与 配 体 结 合 后 , 由 于 净 电 荷 的 降 低 , IDPs 的 无 序 区 会 倾 向 于 形 成 折 叠 状 态 7-8 该 类 蛋 白 在 自 然 界 中 极 为 丰 富 , 并 且 履 行 着很重要的生物学功能,通常是蛋白质相互作用网 络 的 关 键 蛋 白 IDPs
7、 在 分 子 识 别 、 细 胞 周 期 调 控 9-10、 细 胞 信 号 转 导 11、 细 胞 内 调 节 等 多 种 生 理 活动中起到关键作用,细胞中多种生理活动的进行 是 通 过 蛋 白 质 与 其 配 体 相 互 作 用 来 实 现 的 12, IDPs- 配 体 的 相 互 作 用 亦 介 导 了 重 要 的 生 物 学 功 能 此 外 , IDPs 还 与 一 些 重 大 疾 病 的 发 生 有 密 切 关系 13,如与癌症相关的 P53 蛋白、与帕金森疾病 相 关 的 -synuclein 和 tau 蛋 白 等 均 是 固 有 无 序 蛋 白近年来有文献指出 14-15,
8、IDPs 的 无 序 区 域 在 与 生物分子的相互作用中也起到了重要的作用IDPs 的 无 序 区 域 可 以 参 与 一 对 多 或 者 多 对 一 的 相 互 作* 国 家 自 然 科 学 基 金 (31000324, 61271378, 30970561)和 山 东 省 自 然 科学基金(ZR2011FL011, ZR2012CL09) 资助项目.* 通讯联系人.Tel: 0534-8985933, E-mail: 收稿日期:2013-05-17,接受日期:2013-08-142014; 41 (5) 董川 , 等:固有无序蛋白与蛋白质相互作用位点残基特征分析 463用 , 这 是 I
9、DPs 功 能 多 样 性 的 重 要 原 因 16 因 此 , 研 究 固 有 无 序 蛋 白 与 其 他 生 物 大 分 子 的 相 互 作 用 , 尤其是与其他蛋白质的相互作用具有重要意义随 着 实 验 技 术 的 改 进 及 提 高 , 被 发 现 的 IDPs 的数量正在迅速增加由美国印第安那大学生物信 息 中 心 创 建 并 维 护 的 无 序 蛋 白 数 据 库 (http:/www. disprot.org/)中,所收录的无序蛋白及无序区域的数 目 已 经 由 2004 年 第 1 版 的 154 个 和 190 条 增 加 到 2012 年 最 新 版 的 654 个 和 1
10、 513 条 此 外 , IDPs 所具有的未知生物学功能也正在进一步被揭示对 IDPs 的 研 究 已 经 成 为 生 物 学 领 域 的 热 点 问 题 之 一 目 前 , 国 内 外 针 对 IDPs 开 展 了 大 量 的 研 究 工 作 并 取 得 了 一 系 列 的 成 果 本 课 题 组 17曾 对 IDPs 有 序 与 无 序 接 点 处 的 残 基 特 征 进 行 了 分 析 , 发 现 IDPs 接 点 两 侧 氨 基 酸 的 疏 水 性 有 较 大 差 别 Wojtas 等 18研究了抗衡离子 (counter ion)与 IDPs 的 作 用 , 结 果 表 明 抗 衡
11、 离 子 会 通 过 减 小 IDPs 的 静 电 排 斥 力 进 而 改 变 IDPs 的 构 象 有 的 研 究 小 组 19针 对 IDPs 展 开 了 分 子 动 力 学 模 拟 研 究 , 并 发 展 出 针 对 IDPs 的 全 原 子 及 原 子 团 的 模 拟 方 法 Fuxreiter 小 组 20研 究 了 24 条 IDPs 在 与 配 体 结 合 状 态 时 骨 架 转 角 和 二 级 结 构 的 分 布 , 以 及 配 体 对 IDPs 折 叠 的 影响,发现形成 coil 结构的氨基酸占较大比例,即 使 IDPs 与 配 体 结 合 时 , 它 们 的 结 构 也
12、并 不 是 完 全 有 序 的 除 此 之 外 , 有 很 多 学 者 基 于 现 有 的 蛋 白 质 - 配体结构数据,开发了一系列的软件用于预测蛋白 质与其他配体相互作用时的作用位点残基 21-23但 是,一方面,这些预测软件的预测精度有待进一步 提 高 , 另 一 方 面 , 尚 未 见 针 对 IDPs 与 其 他 成 分 相 互作用位点残基预测的报道随着实验技术及计算 方 法 的 发 展 , 结 合 位 点 的 残 基 特 征 将 被 进 一 步 挖 掘 , 这 些 都 有 利 于 进 一 步 提 高 预 测 精 度 , 与 此 同 时,随着 IDPs 与其他蛋白质相互作用研究的深入
13、, 可 发 展 新 的 针 对 IDPs 与 其 他 成 分 相 互 作 用 位 点 残 基的预测软件本 文 基 于 现 有 的 数 据 库 对 固 有 无 序 蛋 白 (IDPs) 与其他蛋白质相互作用位点残基特征进行了研究 首先提取出所有相应复合物中的作用位点残基,接 着 对 IDPs- 蛋 白 质 复 合 物 的 作 用 位 点 残 基 进 行 了 分析1 数据集的构建与研究方法本研究中固有无序蛋白取自固有无序蛋白数据库(Disprot,http:/www.disprot.org/),蛋白质复合物 结 构 来 源 于 蛋 白 质 结 构 数 据 库 (PDB, http:/www.rcs
14、b. org/pdb/home/home.do)PDB 数 据 库 中 无 序 蛋 白 - 蛋 白 质 复 合 物 的 选 取 满 足 以 下 条 件 : a 所 研 究 的 IDPs 链在复合物中没有突变;b对采用 X 射线晶 体 衍 射 技 术 得 到 的 结 构 , 要 求 分 辨 率 在 5魡 以 内 ; c对采用核磁共振技术得到的结构,选取 PDB 文 件中第一个结构;d不考虑非上述 b、c 中的测定 技术得到的复合物结构根据这 4 个条件,筛选出 126 条 IDPs 链 为 了 避 免 对 相 似 性 较 高 的 IDPs 链 重 复 研 究 , 使 数 据 集 更 加 可 靠
15、, 我 们 基 于 PISCES 在线软件(http:/dunbrack.fccc.edu/PISCES.php) , 对 筛选出的 126 条固有无序蛋白质链进行了去冗余处 理选择 IDPs 链的总长度大于 40 个氨基酸的蛋白 质 链 , 并 且 将 相 似 性 高 于 25% 的 IDPs 链 全 部 去 除 最 后 我 们 筛 选 出 数 据 集 中 符 合 条 件 的 109 条 IDPs 链及 299 个 IDPs- 蛋白质复合物在以往的研 究中 24-25,蛋白质 - 蛋 白 质 相 互 作 用 位 点 残 基 是 根 据 目 标 蛋 白 与 其 他 配 体 蛋 白 之 间 的
16、距 离 来 定 义 的 , 当目标蛋白的氨基酸残基与其他配体蛋白氨基酸残 基之间的距离小于某个阈值时,就认为该氨基酸是 目标蛋白 - 蛋白质的作用位点残基本文亦根据残 基间距离来定义 IDPs- 蛋 白 质 的 作 用 位 点 残 基 , 当 无序蛋白氨基酸残基的任一原子与其相互作用蛋白 质 的 任 一 原 子 间 距 小 于 5魡 时 , 认 为 这 个 氨 基 酸 残 基 就 是 IDPs 与 其 他 蛋 白 质 相 互 作 用 时 的 作 用 位 点 残 基 IDPs 无 序 区 域 与 有 序 区 域 的 划 分 , 依 据 disprot 数据库中的标注2 结果与讨论2 1 IDPs
17、-蛋白质作用位点残基数据集的特征经 过 去 冗 余 处 理 后 得 到 的 109 条 IDPs 中 , 共 包含 50 031 个 氨 基 酸 残 基 , 其 中 属 于 IDPs 无 序 区域的残基有 11 285 个(占 22.6%),属于有序区域的残基有 38 746 个( 占 77.4%) 根 据 作 用 位 点 残 基 的 定义,这些氨基酸残基形成 IDPs- 蛋 白 质 作 用 位 点 残 基 4 822 个 , 其 中 , 落 在 IDPs 无 序 区 域 的 有 1 241 个 , 落 在 有 序 区 域 的 有 3 581 个 每 种 残 基 形 成 IDPs- 蛋 白 质
18、 作 用 位 点 残 基 的 情 况 如 图 1 所 示,图中用不同灰度表示作用位点残基位于有序区 域或无序区域464 生物化学与生物物理进展 Prog. Biochem. Biophys. 2014; 41 (5)Fig. 1 Distribution of 20 kinds of amino acids forming IDPs-Protein interaction sitesGrey represents binding sites located in disordered regions and black represents binding sites located in o
19、rdered regions. : Binding sites in ordered region; : Binding sites in disordered region.由 图 1 可 以 看 出 , 20 种 氨 基 酸 残 基 在 形 成 作 用 位 点 时 , 它 们 在 IDPs 的 有 序 区 域 出 现 的 频 数 由 小 到 大 依 次 是 : TRP、 CYS、 HIS、 MET、 PRO、 ASN、 TYR、 GLN、 PHE、 GLY、 ASP、 SER、 ALA、 ILE、 THR、 ARG、 VAL、 LYS、 GLU、LEU, 在 无 序 区 域 出 现 的 频
20、 数 由 小 到 大 依 次 是 : CYS、 TRP、 HIS、 TYR、 MET、 PHE、 ASN、 GLN、 PRO、 ILE、 GLY、 THR、 VAL、 LYS、ARG、ALA、SER 、ASP、GLU、LEU从总体上 看 LEU、GLU、LYS、ARG、VAL 形 成 作 用 位 点 残 基 时 具 有 较 大 的 频 数 , 而 CYS、 TRP、 HIS、 MET、TYR 形 成 作 用 位 点 残 基 时 的 频 数 较 小 从 图 1 可知,IDPs- 蛋 白 质 的 作 用 位 点 残 基 在 有 序 区 域出现的频数比较大,并不意味着它们在无序区出 现 的 频 数
21、也 很 大 例 如 PRO 与 PHE 这 两 种 氨 基 酸,虽然 PHE 在 IDPs 作 用 位 点 残 基 的 有 序 区 域 处 出现的频数较 PRO 大,但是 PHE 在 无 序 区 出 现 的 频 数 要 小 于 PRO 这 提 示 : 同 一 种 氨 基 酸 在 形 成 IDPs- 蛋 白 质 作 用 位 点 残 基 时 , 在 有 序 区 域 与 无 序 区 之 间 可 能 具 有 不 同 的 倾 向 性 , 这 可 能 是 由 IDPs 无序区与有序区理化性质的差异引起的由图 1 还可看出,对于同一种氨基酸而言,落 在 IDPs 有序区的频数总是大于落在 IDPs 无序区的
22、 频 数 , 但 这 并 不 意 味 着 IDPs 更 倾 向 于 通 过 有 序 区 与其他蛋白质发生相互作用首先,在所研究体系中 , IDPs 有 序 区 域 的 长 度 大 于 无 序 区 域 的 长 度 , 相 应 氨 基 酸 的 含 量 分 别 为 77.4%和 22.6%; 其 次 , 研 究 体 系 中 IDPs 仅 通 过 有 序 区 域 或 仅 通 过 无 序 区 域与其他蛋白质相互作用的复合物所占比重分别为 50.2%和 20.4%, 同 时 通 过 有 序 区 和 无 序 区 域 与 其 他蛋白质相互作用的复合物占 29.4%进一步分析 发现,那些仅通过有序区域与其他蛋白
23、质分子作用 体 系 的 作 用 位 点 残 基 却 倾 向 于 落 在 IDPs 的 有 序 与 无 序 区 域 的 接 点 附 近 , 这 说 明 IDPs 的 无 序 区 在 IDPs- 蛋白质相互作用中起了重要的作用2 2 IDPs-蛋白质作用位点残基倾向性仅根据作用位点位于有序和无序区域的数目来 判断氨基酸形成 IDPs- 蛋 白 质 相 互 作 用 位 点 残 基 的 倾向性,有一定局限性,这是因为作用位点残基出 现 的 频 率 会 受 到 相 应 氨 基 酸 在 IDPs 中 出 现 频 率 的 影 响 有 些 学 者 26曾 用 BP(binding propensities)来
24、衡 量蛋白质 - 核酸复合物界面氨基酸与核苷酸的偏好 性 为 了 分 析 不 同 氨 基 酸 形 成 作 用 位 点 残 基 的 偏 好 , 我 们 计 算 了 所 研 究 数 据 集 中 的 每 种 氨 基 酸 在 IDPs 中出现的几率和在 IDPs- 蛋白质复合物作用位 点残基集合中出现的几率,如图 2 所示,图中的直 线斜率为 1图 2 中每一个点代表一种氨基酸残基,横坐标 表 示 氨 基 酸 残 基 在 IDPs 中 出 现 的 几 率 , 纵 坐 标 表 示相应氨基酸在作用位点残基集合中出现的几率500450400350300250200150100500ALA ARG ASN A
25、SP CYS GLN GLU GLY HIS ILE LEU LYS MET PHE PRO SER THR TRP TYR VALAmino acidBindingsites number2014; 41 (5) 董川 , 等:固有无序蛋白与蛋白质相互作用位点残基特征分析 465由图 2 可以看出,20 种氨基酸残基被一条斜率为 1 的 直 线 分 成 三 部 分 : 位 于 直 线 附 近 、 位 于 直 线 下 方、位于直线上部TRP CYS HIS MET据 集 中 出 现 的 几 率 也 就 是 说 , 该 部 分 氨 基 酸 在 IDPs 中 出 现 的 几 率 虽 然 小 , 但
26、 是 它 们 在 形 成 IDPs- 蛋 白 质 的 作 用 位 点 时 却 可 能 会 有 一 个 较 大 的 几 率 ; 同样的道理,对于落在直线下方的氨基酸残基,在 IDPs 中出现的几率较大,但是它们在 IDPs- 蛋白质 的 作 用 位 点 集 合 中 却 有 一 个 相 对 较 小 的 几 率 20Frequency of amino acids in IDPsTYRPHE ASN GLNILE ARG THRPRO ASPGLY VAL LYS ALA SER GLU LEU种氨基酸的这些特性表明不同的氨基酸残基在形成 IDPs- 蛋 白 质 的 作 用 位 点 时 表 现 为
27、不 同 的 倾 向 性 为了衡量哪些氨基酸倾向于形成 IDPs- 蛋 白 质 的 作 用 位 点 残 基 , 我 们 引 入 了 AAP (amino acids propensity)参数 AAP 定义为:AAP(X)= PBS(X) -1PPR(X)其 中 , PPR(X)表 示 氨 基 酸 X 在 109 条 IDPs 链Fig. 2 The distribution of each amino acid in residue ensemble of IDPs and IDPs-proteins interface sitesx-Axis represents amino acids p
28、robability in 109 IDPs chains and y-Axis represents amino acids probability in IDPs-protein interface. Red and blue points denote that amino acids deviate from the straight-line obviously. The slope of straight-line is 1.对 于 落 在 直 线 上 方 的 氨 基 酸 而 言 , 其 在 IDPs-蛋 白 质 作 用 位 点 集 合 中 出 现 的 几 率 大 于 在 IDPs
29、数中出现的几率, PBS(X)表示氨基酸 X 在 作 用 位 点 集 合中出现的几率根据 AAP 的大小,可以判断氨基酸形成 IDPs- 蛋白质作用位点残基的偏好性 AAP0,对应于图 2 中 位 于 单 位 斜 率 直 线 上 方 的 氨 基 酸 , 该 部 分 氨 基 酸 具 有 形 成 IDPs- 蛋 白 质 作 用 位 点 残 基 的 倾 向 性 ; 相反, AAP0.1 的 氨 基 酸 , 定 义 为 倾 向 型 氨 基酸; AAP-0.1 的 氨 基 酸 , 称 之 为 非 倾 向 型 氨 基 酸 ; -0.1AAP0.1 的 氨 基 酸 称 之 为 中 间 型 氨 基 酸 在 图
30、 3 中 可 以 看 出 , 倾 向 型 氨 基 酸 主 要 有 : ILE、 LEU、 ARG、 PHE、 TYR、 MET、 TRP; 非倾 向 型 氨 基 酸 主 要 有 : PRO、 SER、 GLY、 ALA、 ASN、 CYS; 中 间 型 氨 基 酸 有 : GLN、 GLU、 THR、LYS、VAL、ASP、HIS Fuxreiter 等 20研 究 发 现 , 无 序 蛋 白 的 某 些 区 域 倾 向 于 形 成 -helix, 这些局部的二级结构常参与蛋白质 - 蛋白质的相互 作 用 而 PRO 是 -helix 的 最 强 终 止 者 , 所 以 说0.120.100.
31、080.060.040.0200.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09BindingsitesfrequencyAAP466 生物化学与生物物理进展 Prog. Biochem. Biophys. 2014; 41 (5)PRO 不 易 出 现 在 蛋 白 质 - 蛋 白 质 相 互 作 用 的 界 面 处这与图 3 中 PRO 具有最小的 AAP 值 最 不 容 易 形成 IDPs- 蛋白质的作用位点残基相一致 2 3 氨基酸在 IDPs 的不同区域特性同一种氨基酸在形成 IDPs- 蛋 白 质 作 用 位 点 残 基 时 , 在 IDPs 的
32、 有 序 与 无 序 区 域 可 能 具 有 不 同 倾 向 性 为 了 分 析 它 们 的 差 异 性 , 我 们 将 109 条 IDPs 蛋 白 质 链 残 基 集 合 分 成 两 部 分 : 有 序 区 域 残由 此 计 算 出 每 种 氨 基 酸 在 不 同 区 域 的 AAP 值 , 即 无 序 区 域 残 基 的 AAP 值 (disAAP)和 有 序 区 域 残 基 的 AAP(orderAAP) 计算公式如下所示:orderAAP(X)= POBS(X) -1POPR(X)disAAP(X)= PDBS(X) -1PDPR(X)式 中 POBS(X)和 POPR(X)分 别
33、是 氨 基 酸 X 在 子 集SOBS 和 SOPR 中出现的几率, PDBS(X)和 PDPR(X) 分别是基 子 集 SOPR 和 无 序 区 域 残 基 子 集 SDPR, IDPs- 蛋 白质作用位点残基集合也分为两部分:落在有序区域 氨 基 酸 X 在 子 集 SDBS 和 SDPR 中 出 现 的 几 率 各 氨的残基子集 SOBS 和 落 在 无 序 区 域 的 残 基 子 集 SDBS 基酸在不同区域的 AAP 值如图 4a 所示(a)(b)Fig. 4 Compared with the 20 kinds of amino acids AAP values in IDPs d
34、ifferent regions(a) AAP values of amino acids in different regions of IDPs. Grey indicates disordered regions and black indicates ordered regions. : disAAP; : orderAAP. (b) The absolute value |disAAP-orderAAP| of AAP in IDPs different regions.图 4a 反 映 了 氨 基 酸 在 IDPs 有 序 与 无 序 区 域 AAP 值 的 差 异 性 从 中 可
35、 以 看 出 , 对 于 IDPs 的 有 序 区 域 而 言 20 种 氨 基 酸 的 AAP 值 由 小 到 大 依 次 是 : PRO、 SER、 GLY、 ALA、 ASN、 CYS、 GLN、 GLU、 ASP、 THR、 VAL、 LYS、 LEU、 HIS、ILE、TRP、ARG 、PHE 、MET、TYR,其中 HIS、 ILE、 TRP、 ARG、 PHE、 MET、 TYR 在IDPs 的 有 序 区 比 较 容 易 形 成 作 用 位 点 残 基 , 而 PRO、SER、GLY、ALA、ASN 不倾向于形成作用 位 点 残 基 ; 无 序 区 域 的 AAP 值 由 小
36、到 大 依 次 是 CYS、 PRO、 SER、 GLY、 ASN、 ALA、 LYS、GLN、 THR、 GLU、 VAL、 HIS、 ASP、 TYR、PHE、 ARG、 ILE、 MET、 LEU、 TRP 对 于 无 序 区 域 而 言 ASP、 TYR、 PHE、 ARG、 ILE、 MET、 LEU、TRP 容 易 形 成 作 用 位 点 残 基 , CYS、 PRO、 SER、 GLY、 ASN、 ALA、 LYS、 GLN、 THR 则不倾 向 于 形 成 作 用 位 点 残 基 ; 无 序 区 域 的 CYS、 GLN、 PRO、SER比在有序区域更不利于形成作用 位 点 残
37、 基 , ASP、 LEU、 ILE、 TRP 则 比 有 序 区 域 更利于形成 IDPs- 蛋 白 质 的 作 用 位 点 残 基 , 而 有 序 区的 TYR、HIS、THR、LYS 比无序区的相应氨基 酸更加有利于形成 IDPs- 蛋白质的作用位点残基1.21.00.80.60.40.20- 0.2- 0.4- 0.6CYS PRO SER GLY ASN ALA LYS GLN THR GLUVAL HIS ASP TYR PHE ARG ILE MET LEU TRPAmino acid1.00.50CYS PRO SER GLY ASN ALA LYS GLN THR GLU V
38、AL HIS ASP TYR PHE ARG ILE MET LEU TRPAmino acid|disAAPorderAAP|AAP2014; 41 (5) 董川 , 等:固有无序蛋白与蛋白质相互作用位点残基特征分析 467为了进一步衡量同一种氨基酸在有序区域与无 序区域形成 IDPs- 蛋 白 质 复 合 物 作 用 位 点 倾 向 性 的 差 别 , 我 们 计 算 了 同 一 种 氨 基 酸 在 IDPs 有 序 与 无序 区 域 的 AAP 之 差 , 即 |disAAP -orderAAP|, 如 图 4b 所 示 这 个 差 值 越 大 说 明 该 氨 基 酸 在 IDPs- 蛋
39、 白 质 作 用 位 点 的 不 同 区 域 的 倾 向 性 差 别 越 明 显 ,反 之 则 越 小 由 图 4b 可 以 看 出 , 同 一 种 氨 基 酸 在 IDPs- 蛋 白 质 不 同 区 域 形 成 作 用 位 点 残 基 的 倾 向 性 不 同 , 其 中 TRP、LEU、ILE、CYS 的 差 别 比 较 明 显;GLU 、PHE、HIS、ALA 基 本 没 有 多 大 差 别 不同氨基酸形成作用位点残基的这种差异性可能是 由不同氨基酸侧链的理化性质以及它所处的序列环 境决定的有 综 述 文 章 指 出 27, IDPs 的无序区域序列与有 序区域序列在平均电荷与平均疏水性等
40、多种理化性 质方面存在差异,这种差异导致有序与无序区域氨 基 酸 分 布 的 不 对 称 性 , 从 而 使 IDPs 有 序 与 无 序 区 域之间存在序列环境上的差异,这可能是影响相应区域氨基酸形成 IDPs- 蛋 白 质 作 用 位 点 倾 向 性 的 原 因之一2 4 氨 基 酸 的 理 化 性 质 对 IDPs-蛋 白 质 作 用 位 点 残 基的影响有 些 文 献 中 提 到 28-29 氨 基 酸 残 基 的 序 列 保 守 性、疏水程度、所处的二级结构、溶剂可及性表面 积及侧链构象熵对作用位点残基的影响较大,除此 之外,我们猜测氨基酸的侧链体积和极性等理化性 质对作用位点的残基
41、倾向性可能有影响基于以上 原因,我们选取了氨基酸的 6 种主要理化性质,来 研 究 其 对 IDPs- 蛋 白 质 作 用 位 点 残 基 倾 向 性 的 影 响 , 这 6 种 理 化 性 质 是 : 疏 水 性 (hydrophobicity, H)、极性 (polarity, PI)、极化率 (polarizability,P2)、 侧 链 体 积 (side chains volume, VSC)、 侧 链 的 净 电 荷指数(net charge index of side chains,NCISC)和溶 剂可及表面积(solvent accessible surface area,
42、 SASA). 每种氨基酸所对应的 6 种理化参数如表 1 所 示 30Table 1 Six major physical and chemical properties of the 20 kinds of amino acids30Amino acid H VSC PI P2 SASA NCISCALA 0.62 27.5 8.1 0.046 1.181 0.007187ARG -2.53 105 10.5 0.291 2.56 0.043587ASN -0.78 58.7 11.6 0.134 1.655 0.005392ASP -0.9 40 13 0.105 1.587 -0.02
43、382CYS 0.29 44.6 5.5 0.128 1.461 -0.03661GLN -0.85 80.7 10.5 0.18 1.932 0.049211GLU -0.74 62 12.3 0.151 1.862 0.006802GLY 0.48 0 9 0 0.881 0.179052HIS -0.4 79 10.4 0.23 2.025 -0.01069ILE 1.38 93.5 5.2 0.186 1.81 0.021631LEU 1.06 93.5 4.9 0.186 1.931 0.051672LYS -1.5 100 11.3 0.219 2.258 0.017708MET
44、0.64 94.1 5.7 0.221 2.034 0.002683PHE 1.19 115.5 5.2 0.29 2.228 0.037552PRO 0.12 41.9 8 0.131 1.468 0.239531SER -0.18 29.3 9.2 0.062 1.298 0.004627THR -0.05 51.3 8.6 0.108 1.525 0.003352TRP 0.81 145.5 5.4 0.409 2.663 0.037977TYR 0.26 117.3 6.2 0.298 2.368 0.023599VAL 1.08 71.5 5.9 0.14 1.645 0.05700
45、4H: Hydrophobicity; VSC: Side chains volume; PI: Polarity; P2: Polarizability; SASA: Solvent accessible surface area; NCISC: Net charge index of side chain.在 上 述 的 研 究 中 定 义 了 AAP, 在 这 里 我 们 仍 然使用上述计算出的 AAP 值 这 里 的 AAP 值主要 包括: IDPs 无 序 区 域 氨 基 酸 的 AAP 值、IDPs 有序区域氨基酸的 AAP 值 氨 基 酸 的 AAP 值 与 各 种 参 数的关系
46、如图 5 所示AAPAAP468 生物化学与生物物理进展 Prog. Biochem. Biophys. 2014; 41 (5)(a)1.20.80.40-0.4-3 -2 -1 0 1 2Hydrophobicity(b)1.40.706 9 12Polarity(c)1.4(d)1.40.7 0.70 0(e)1.40.8 1.6 2.4SASA(f)1.40 0.2 0.4Net charge index of side chain0.7 0.70 00 70 140Side chains volume0 0.2 0.4PolarizabilityFig. 5 The effects
47、of physical and chemical properties on IDP-Protein interface residuesThe x-axis is (a) Hydrophobicity. (b) Polarity. (c) Solvent accessible surface area. (d) Net charge index of side chain. (e) Side chains volume. (f) Polarizability. The y-axis is the AAP value of amino acid. Red circle: amino acids
48、 in disordered region; Blue triangle: amino acids in ordered region. The AAP values are fited through line. : Amino acids in disordered region; : Amino acids in ordered region; : Linear Fit of disAAP; : Linear Fit of orderAAP.由 氨 基 酸 疏 水 性 与 AAP 的 关 系 (图 5a)发 现 , 无 论 是 有 序 区 域 的 氨 基 酸 还 是 无 序 区 域 的 氨 基 酸 , 具 有 较 大 AAP 的 氨 基 酸 多 数 落 在 疏 水 性 指 数 较 大 的 区 域 , 当 然 也 有 个 别 较 大 AAP 的 氨 基 酸 落 在 疏 水性指数较小的区域,多数具有中等疏水性的氨基 酸 的 AAP 值 比 较 小 , 这 说 明 极 端 的 疏 水 性 环 境 有 利于氨基酸形成 IDPs- 蛋 白 质 的 作 用 位 点 图 5 显 示,溶剂可及性表面( 图 5c)和 侧 链 体 积 (图 5e)、氨 基酸的极化率(图 5f)有 一 定 相 关 性 大 部 分 倾 向 型 氨基酸( 具有较大的 AAP 值) 一般具有较大溶剂可及 性表面、较大