1、Chinese Academic of Medical ScienceCenter of System Medicine,组学大数据平台在肿瘤精准医疗中的应用,秦晓峰,中国医学科学院医学生物信息大数据中心苏州系统医学研究所,医疗行业产生大量数据,临床数据来源和分析,临床数据来源:年龄 性别 过敏情况药物测试疾病详情家族史药物接受和排斥曾使用剂量水平生存率诊断测试手术,临床数据分析:生存分析预测,组学数据来源和分析,宏基因组深度挖掘,多组学联合分析,微生物组在肿瘤免疫治疗中的应用,期刊:Science 发表时间:2017.11 实验设计:249名接受过抗PD-1免疫疗法的肺癌、肾癌等多种不同的癌
2、症;免疫治疗前69名患者接受了抗生素的治疗; 研究技术:粪便宏基因组测序 验证:无菌小鼠FMT(粪菌移植)验证; 结果:1)抗生素治疗的患者,癌症很快出现复发,生存时间也更短;2)恢复较好的患者体内,Akkermansia muciniphila的益生菌丰度更高,对癌症免疫疗法还有促进作用;3)接受了“起效者”粪便的小鼠对于PD-1抑制剂的反应要明显优于接受了“无效者”粪便的小鼠,后者在口服Akkermansia muciniphila后,能恢复对免疫疗法的反应。,医生目前面临决策的信息维度大大增加,Hawgood S, Hook-Barnard IG, OBrien TC, Yamamoto
3、 KR. Precision medicine: Beyond the inflection point. Science translational medicine 2015;7:300ps17.,癌症专家助手,阅读和记忆学习医疗文献、临床指导和医学指南,将病人和临床试验方案进行匹配,持续不断的学习 从不断增加的病人的组学数据和临床数据中不断学习,依据最新用药指导推荐潜在的治疗选择方案,Watson医生,由IBM公司开发人工智能系统询问病人的病征、病史人工智能技术自然语言的处理和分析技术从各个渠道搜集到的信息和数据迅速给出诊断提示和治疗意见,针对个人进行纵向密集数据收集可以揭示分子疾病标志
4、物,前瞻性 108个人 全基因组测序分析 临床检测分析 蛋白质组学分析 代谢组学分析 微生物群落分析(对16S rRNA进行测序) 参与者配戴活动跟踪器监测日常活动 创立相关性网络 关联分析 鉴定已知和候选标志物 Meta分析,Price N D, Magis A T, Earls J C, et al. A wellness study of 108 individuals using personal, dense, dynamic data cloudsJ. Nature Biotechnology, 2017, 35(8):747.,在癌症治疗中的联合用药,不同癌症分期的医学研究基因和
5、分子诊断肿瘤信息学传统中药数学分析治疗毒性评价个性化用药,利用深度学习和关联规则挖掘预抗癌药物反应,数据来源:药物基因组689个癌症细胞系和139种抗癌药物。来自CCLP和GDSC.规则关联挖掘深度学习预测药物反应,荧光定量PCR、基因芯片 、SNP分型、 二代测序,组学大数据平台与精准医疗,组学大数据平台在肿瘤精准医疗中的应用,医疗大数据来源,医学术语标准化,处理后的结构化检查描述,将自然语言描述的电子病历转化成结构化、标准化的电子病历,临床数据结构化,覆盖各种可能的组学,组学数据 基因组学数据 转录组学数据 蛋白组学数据 表型组学数据 代谢组学数据 微生物组学数据 ,组学数据格式 fast
6、a/fastq/vcf/sam/bam/gff3/gff2/gtf/bed/ ,组学数据来源,荧光定量PCR基因芯片 SNP分型二代测序 ,检测,组学数据汇集,组学数据来源,TCGA 癌症基因信息的数据库 TGDB 肿瘤基因数据库 ICGC 国际癌症基因组联盟 Oncomine 肿瘤基因芯片数据库 CGAP癌症基因数据库 MethylCancer DNA甲基化与癌症数据库 ,NCBI美国国家生物技术信息中心 美国国家健康研究所、国家医学图书馆 EBI欧洲生物信息研究所 欧洲分子生物学实验室 DDBJ 日本DNA数据库 日本研究机构 BIGD 生命与健康大数据中心 北京科学院北京基因研究所 ,综
7、合数据库,肿瘤相关数据库,组学数据分析处理流程,组学大数据平台在肿瘤精准医疗中的应用,辅助诊疗,辅助诊疗,预测生存期发现新疗法治疗方案预后方案,致病基因肠道菌群药物代谢/靶标肿瘤驱动基因,辅助科研,药物推荐联合用药指导药物不良反应评估,用药指导,荧光定量PCR、基因芯片 、SNP分型、 二代测序,组学大数据平台与精准医疗,乳腺癌组学数据分析与可视化平台BCIP,15个临床特征 三阴/非三阴型 PAM50型 组织学分级 病理分期 转移状态 淋巴结转移 ER PR Her2+ TP53突变 是否绝绝经 年龄 肿瘤大小 疗效 预后,临床特征抽提,生存分析,MELK的过量表达与较差预后相关表明MELK
8、与基底样乳腺癌相关,拷贝数变化,在METABRIC数据集PAM50亚型中拷贝数减少和增加的百分比情况,差异表达分析,肿瘤组织相比于周围正常组织,MELK的表达量要高出许多PAM50型乳腺癌中的基底样乳腺癌,MELK的表达量最高。,共表达分析,分析MELK影响基底样乳腺癌的机理在基底样乳腺癌的METABRIC数据集中,MELK与包括CDCA5,TPX2和CEP55在内的78个基因共表达。一些研究已经阐述了TPX2和CEP55是参与乳腺癌转移、侵袭、增殖和扩散的关键分子。CDCA5也被报道在肺癌中起关键作用,并可作为口腔鳞细胞癌的治疗靶点。这些结果都可以作为挖掘MELK在乳腺癌中的潜在功能和机制的
9、有用线索。肿瘤组织相比于周围正常组织,MELK的表达量要高出许多,miRNA靶相互作用分析,发现hsa-miR-193b-3p and hsa-miR-372-5p与miRNA靶相互作用有关,KEGG通路分析,荧光定量PCR、基因芯片 、SNP分型、 二代测序,组学大数据平台与精准医疗,Integration of Exoseq and RNAseq data for tumor antigen profiling,pipeline pVAC-Seq (personalized Variant Antigens by Cancer Sequencing),输入数据的准备 (全基因组与全外显子组
10、测序) BWA;SAMtools;VarScan somatic;Strelka;Tophat;Ovation;Truseq;Cufflinks Variant Effect Predictor VEP,抗原表位预测 FASTA文件生成 运行抗原预测软件NetMHC 结果解析,整合测序信息 Coverage & Variant Allele Frequency (VAF),候选抗原的过滤 深度过滤 基因表达,Hundal J, Carreno B M, Petti A A, et al. pVAC-Seq: A genome-guided in silico, approach to identifying tumor neoantigensJ. Genome Medicine, 2016, 8(1):11.,荧光定量PCR、基因芯片 、SNP分型、 二代测序,组学大数据平台与精准医疗,人体自免疫的抗原数据库平台 AAgAtlas1.0,文本挖掘机器学习人工校验 ,自抗原知识库,人类自抗原分类,知识库建设过程,与自抗原有关的疾病,人体自免疫的抗原数据库平台 AAgAtlas1.0,荧光定量PCR、基因芯片 、SNP分型、 二代测序,组学大数据平台与精准医疗,谢谢批评指正!,ISM,