1、用搜狗浏览器下载下来的文件打不开,必须换 IE 浏览器打开网页再下载数据!我觉得 Haploview 最好的课件就是在他的官网,里面有一个 “User Manual”:http:/www.broadinstitute.org/haploview/user-manual实验三、Browsers and Tools for Genetic Variants Analysis 4 学时 基础性http:/ HapMap Generic Genome Browser, NCBI dbSNPs, Haploview教学要求:了解三者的主要内容,及主要功能。HapMap phaseI,phaseII 是全
2、面的有关人类遗传变异数据库,NCBI dbSNP 存储了所有的人类 SNP 数据,Haploview 是通用的 LD 分析软件。理解 dbSNP 所存储的所有人类 SNP 数据,质量并不是都很可靠的,因此 dbSNP 为每一个 SNP专门设置了“Validation Status”信息。掌握从 HapMap 和 dbSNP 中获取一段染色体片断相关的遗传变异信息。重点:掌握从 HapMap 和 dbSNP 中获取一段染色体片断相关的遗传变异信息。难点:如何使用 Haploview 工具进行 LD 分析。其它教学环节:实验课刚开始,授课老师结合 ppt,以人类 BRCA2 基因为例,讲授本次实验
3、课的主要内容,并布置本次实验作业。在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。Haploview 是一个进行单倍型分析的一个软件,该软件具有如下功能:1.连锁不平衡与单倍型分析 2.单倍型人群频率估算 3.SNP 与单倍型关系分析 4.相互关系的排列测验 5.可以从 HapMap 上直接下载基因型信息 网址:http:/www.broadinstitute.org/haploview下载:Windows 版: HapInstall.exe Mac / Unix / Linux
4、 Haploview.jar (安装:java -jar Haploview.jar) JAVA 下载在安装该软件之前,必须先安装一个“JAVA ”,Haploview 必须在 JAVA 环境下才能运行。首先要选择要分析数据的类型,包括 Linkage format 、 Haps format 、 Hapmap format、Phase format 等。我们主要选 Hapmap format 这种类型。这种类型的数据可以直接从 Hapmap 网站(www.hapmap.org)中直接下载。1,进入 Hapmap 网站。依次:Data/Generic Genome Browser(数据/ 通用
5、基因组浏览器) 。输入要查询的基因名称,如 xrcc1,在右面选择“显示 SNP genotype data”, 点击配置根据需要选择 CHB(中国汉族人群)。Output format(打开格式)选择 Open directly in HaploView(输出后的文件可直接导入 Haploview 软件) 。点击“执行” ,将文件保存到指定位置比如桌面。 打开 haploview 软件,选择 Hapmap format,点击 browse,选择刚刚下载下来的文件。左边的 LD Plot 表示该基因所以 snp 的的连锁情况,各个方块的颜色由浅至深(白红) ,表示连锁程度由低到高,深红色表示完
6、全连锁。在方块上点击右键,可以看到连锁的具体信息。点击“tagger” ,可以进一步选择标签 snp。r2 指的是两个位点间的统计学关联。一般认为两点间的 r2 大于或等于 0.8,就可以用一个点代表另外一个点。点击“Run Tagger”,即可出现符合条件的 tagger snp(标签 snp) 。-Hapmap 网站简介:国际人类基因组单体型图计划(简称 HapMap 计划)是由加拿大、中国、日本、尼日利亚、英国和美国共同资助和合作进行的项目,旨在建立一个将帮助研究者发现人类疾病及其对药物反应的相关基因的公众资源。http:/www.broadinstitute.org/scientifi
7、c-community/science/programs/medical-and-population-genetics/haploview/haploviewHaploview can be cited with the following paper:Barrett JC, Fry B, Maller J, Daly MJ. Haploview: analysis and visualization of LD and haplotype maps. Bioinformatics. 2005 Jan 15 PubMed ID: 15297300 Information about the
8、exact test for HW can be found in the following paper:Wigginton JE, Cutler DJ, Abecasis GR. A note on exact tests of Hardy-Weinberg equilibrium. Am J Hum Genet. 2005 May;76(5):887-93. Information about parenTDT can be found in the following paper:Purcell S, Sham P, Daly MJ. Parental phenotypes in fa
9、mily-based association analysis. Am J Hum Genet. 2005 Feb;76(2):249-59. 1.Haploview: Visualization and analysis of SNP genotype data.Barrett JC.Cold Spring Harb Protoc. 2009 Oct;2009(10):pdb.ip71.PMID: 20147036 PubMed - indexed for MEDLINE Related citations 2.Haploview: analysis and visualization of
10、 LD and haplotype maps.Barrett JC, Fry B, Maller J, Daly MJ.Bioinformatics. 2005 Jan 15;21(2):263-5. Epub 2004 Aug 5.bioinfotech 16:40:26 2011.2.25Haploview: Visualization and analysis of SNP genotype data.Barrett JC.Cold Spring Harb Protoc. 2009 Oct;2009(10):pdb.ip71.bioinfotech 16:51:20http:/cshpr
11、otocols.cshlp.org/cgi/content/abstract/2009/10/pdb.ip712008-01-23 01:13 我现在在 mayo clinic 做 postdoc,主要做药物遗传学的。对 SNP 和 Affymetrix 和 illumina 的Chips 有些了解(我们实验室有几百万美元的 mRNA Chips) ,鉴于这一领域内容比较新,国内做的较少,所以愿意跟大家探讨,分享我的一些想法和体会。title 有些夸大,主要是为了吸引更多的人进来。当然也可以给我的信箱留言:。HapMap 介绍HapMap 是国际上针对人类基因组的又一重大合作项目.该计划的目标
12、为:determine the common patterns of DNA sequence variation and find Tag SNPs representing all SNPs in the human genome.构建人类 DNA 序列中多态位点的常见模式,找出代表整个人类基因图谱之中的 SNP 集合的标签SNP。The goal of the International HapMap Project is to determine the common patterns of DNA sequence variation in the human genome and
13、to make this information freely available in the public domain.HapMap 的工作内容: An international consortium is developing a map of these patterns across the genome by determining the genotypes of one million or more sequence variants, their frequencies and the degree of association between them, in DNA
14、 samples from populations with ancestry from parts of Africa, Asia and Europe.HapMap 完成后的意义: The HapMap will allow the discovery of sequence variants that affect common disease, will facilitate development of diagnostic tools, and will enhance our ability to choose targets for therapeutic interventi
15、on.1、发现常见疾病的序列变异 2、为研究者提供方便的诊断工具3、增强我们进行治疗时选择治疗目标的能力。官方网站为:www.hapmap.org.在看文这篇文章以后将对 HapMap 这个网站的内容进行详细的分析。 Non-synonymous single polymorphisms (nsSNP)Haploview 使用方法图解 Step By StepHaploview 是一个进行单倍型分析的一个软件,该软件具有如下功能:1.连锁不平衡与单倍型分析2.单倍型人群频率估算3.SNP 与单倍型关系分析4.相互关系的排列测验5.可以从 HapMap 上直接下载基因型信息 该软件网址 http
16、:/www.broad.mit.edu/mpg/haploview/ 用户可以点击左面的download 下载该软件 (配置 SNP genotype data 上的下拉框,现在没有 RS 号了啊,只有 fwd 和 rev .我选 fwd 或 rev 下载后,用你说的方法导入 Haploview,但是显示出错。是为什么?是不是下载的 rs 号 的文件和 fwd 的文件不一样?)在方块上点击右键,可以看到连锁的具体信息。点击“tagger”,可以进一步选择标签 snp。r2 指的是两个位点间的统计学关联。一般认为两点间的 r2 大于或等于 0.8,就可以用一个点代表另外一个点。在安装该软件之前,
17、必须先安装一个“JAVA”, Haploview 必须在 JAVA 环境下才能运行. JAVA” 和 Haploview 均可在该网站免费下载,安装好的界面如下:首先要选择要分析数据的类型,包括 Linkage format 、 Haps format 、 Hapmap format、Phase format 等。我们主要选 Hapmap format 这种类型。这种类型的数据可以直接从 Hapmap 网站(www.hapmap.org)中直接下载。 输入要查询的基因名称,如 xrcc1,在右面选择“ 显示 SNP genotype data”, 配置。选择 CHB(中国汉族人群 )Outpu
18、t format(打开格式)选择 Open directly in HaploView 图片:63452050_snap.jpg 点击“执行”,将文件保存到指定位置比如桌面。 打开 haploview,选择 Hapmap format,点击browse,选择刚刚下载下来的文件。左边的 LD Plot 表示该基因所以 snp 的的连锁情况,各个方块的颜色由浅至深(白红),表示连锁程度由低到高,深红色表示完全连锁。 在方块上点击右键,可以看到连锁的具体信息。点击“tagger”,可以进一步选择标签 snp。r2 指的是两个位点间的统计学关联。一般认为两点间的 r2 大于或等于 0.8,就可以用一个
19、点代表另外一个点。 点击“Run Tagger”,即可出现符合条件的 tagger snp(标签 snp) 。 (完) 按这个方法在不同时期从 Hapmap 网站(www.hapmap.org)中下载过两个 Hapmap format 类型的分析数据,最后显示的 tagSNP 的结果不一致,是数据库更新的原因吗,TagSNP 选择,根据你指定的标准,无论你使用软件还是直接在 Hapmap 网站直接操作,都是随机产生组合,所以每一次操作结果可能不同,但都是代表整个基因的 SNP。这就像,比如一共有 3 种水果:苹果、香蕉、西瓜用来代表所有的水果,规定是你选择 2 个既可以代表所有水果,那么就可以
20、有 3 中组合。以此类推! 国际人类基因组单体型图计划的目标是构建人类 DNA 序列中多态位点的常见模式,即单体型图,简称 HapMap。 HapMap 将成为研究人员确定对人类健康和疾病以及对药物和环境的反应有影响的相关基因的关键信息。这一项目所产生的一切数据将供免费使用。HapMap 计划将由 日本、英国 、加拿大、中国、尼日利亚和美国的科学家们合作完成【见参加机构】 。项目正式开始于 2002 年 10 月 27-29 日的 HapMap 计划第一次会议(http:/genome.gov/10005336) ,预计进行 3 年。人类单倍体型图计划 - 遗传多态性和单体型图的用途大多数常见
21、的疾病,如糖尿病、癌症、中风、心脏病、抑郁症、哮喘等,受众多基因以及环境因子共同作用。尽管任意两个不相关的人的 DNA 序列有 99.9%是一致的,剩下的那 0.1%由于包含了遗传上的差异因素而非常重要。这些差异造成人们罹患疾病的不同风险和对药物的不同反应。发现这些与常见疾病相关的 DNA 序列上的多态位点,是了解引起人类疾病的复杂原因的最重要途径之一。在基因组中,不同个体的 DNA 序列上的单个碱基的差异被称作单核苷酸多态性(SNPs ) 。例如,某些人的染色体上某个位置的碱基是 A,而另一些人的染色体的相同位置上的碱基则是 G。同一位置上的每个碱基类型叫做一个等位位点。除性染色体外,每个人
22、体内的染色体都有两份。一个人所拥有的一对等位位点的类型被称作基因型(genotype) 。对上述 SNP 位点而言,一个人的基因型有三种可能性,分别是 AA,AG 或 GG (请参考 http:/www.dnaftb.org/dnaftb/ 了解基本的遗传学知识) 。基因型这一名称即可以指个体的某个 SNP 的等位位点,也可以指基因组中很多 SNPs 的等位位点。检定一个人的基因型,被称作基因分型(genotyping ) 。人类的所有群体中大约存在一千万个 SNP 位点,其中稀有的 SNP 位点的频率至少有 1%。相邻SNPs 的等位位点倾向于以一个整体遗传给后代。位于染色体上某一区域的一组
23、相关联的 SNP 等位位点被称作单体型(haplotype) 。大多数染色体区域只有少数几个常见的单体型(每个具有至少 5%的频率) ,它们代表了一个群体中人与人之间的大部分多态性。一个染色体区域可以有很多 SNP 位点,但是只用少数几个标签 SNPs,就能够提供该区域内大多数的遗传多态模式。单体型图将描述人类常见的遗传多态模式。它包括染色体上具有成组紧密关联 SNPs 的区域,这些区域中的单体型,以及这些单体型的标签 SNPs。同时,单体型图还将标示出那些 SNP 位点关联不紧密的区域。研究者一般通过比较患者和非患者来发现影响某种疾病例如糖尿病的基因。在两组单体型频率不同的染色体区域,就有可
24、能包含疾病相关基因。理论上,研究者通过对全部一千万个 SNP 位点都进行基因分型,也能够寻找到这样的区域。但是,目前用这种方法进行检定的成本是过于昂贵。通过单体型图计划将鉴定出 20100 万个标签 SNP 位点,从而提供与一千万个 SNP 位点大致相同的图谱信息。这样将大幅度地减少成本使研究易于进行。人类单倍体型图计划 - 人群和样品大多数常见的单体型存在于所有的人类群体中,但它们在不同人群中频率不同。因此,为了选择标签 SNPs,有必要获得几个人群的数据。先期的研究发现,单体型频率在尼日利亚(Yoruba ) 、日本、中国和美国(1980 年由 Centre dEtude du Polym
25、orphisme Humain 【CEPH】 采集并曾用于其它人类遗传图谱研究的北欧和西欧后裔的样品)人群样本中有着显著的差异。这些差异性保证了通过对这些人群进行大规模的单体型分析的合理性,因而自上述人群的绘制的单体型图应当对世界上所有的人群有益。然而,增加其他人群会获得多少更多信息将通过一项检查其他样品的若干染色体区域的单体型的平行研究做出确切回答。用于构建单体型图计划的 DNA 样品共有 270 份,分别来自 90 个尼日利亚 Ibadan 的 Yoruba 人(30 个父母加一个后代组成的三体家系) ,45 个东京的日本人(无关个体) ,45 个北京的汉族(无关个体) ,和 90 份 C
26、EPH 样品(30 个三体家系) 。样品的数目能使通过单体型图计划发现几乎全部频率大于 5%的单体型。在经过恰当的社群参与(community engagement)或公众咨询以及个人的知情同意后,本项目所有新样品的采集程序都获得了相应的伦理委员会的批准。设计社群参与的目的则是为了对具有不同文化背景的取样社群产生的对知情同意和样本采集程序的特殊疑问有所理解和反馈。CEPH 样品是从非盈利的 Coriell 医学研究所获得(http:/locus.umdnj.edu/nigms/) 。2004 年,经相应的伦理委员会批准后,Coriell 将为进一步的研究提供其他血样的 DNA 或细胞系。样品中
27、只有人群和性别的标识而没有医学或个体的可辨别信息。每一个采集新样品的社群将成立一个咨询委员会,以保持同 Coriell 的联络并确保这些样品将来的使用与知情同意书上的条款是一致的。伦理学问题:这一项目包含若干伦理学问题。因为所研究的样本并不包含捐献者的个人标识,所以泄漏个人信息的风险很小。不过,为了以后研究者能够针对所研究人群选择最佳的标签 SNPs,每一个样本将按人群标记。标签 SNPs 的选择将以单体型频率为基础。如果基因组中某些特定区域的单体型在不同的人群中有显著不同的频率,那么这些区域的标签 SNPs 也可能因人群而异。所以,每个人群的 SNP 和单体型频率将被计算和用于比较研究。在这
28、种情况下,如果在一个人群中发现了一个高频的疾病相关的变异位点,而且与此位点相关的疾病风险在该人群中高于所有或大多数其他人群,就有可能产生对这个群体的诬蔑和歧视。本研究另一个潜在的顾虑是人群的含义来自祖先的居住地域,这可能导致“种族”的划分,而这种更多具有社会含义的划分常被错误地以为是有准确的生物学含义的。项目将通过社群参与来了解目标人群对这些问题的看法或疑问。科学策略为了构建单体型图,要对样本的至少 100 万 SNPs 进行全基因组规模的基因分型检测。在本研究计划起步时,dbSNP 公共数据库中共有 280 万个 SNPs。然而,很多染色体区域的 SNPs 太少,另有很多 SNPs 则因为频
29、率太低而无法使用。所以,构建单体型图还需要数百万更多的 SNP 位点。截止到 2003 年 9 月,本项目又发现的 280 万 SNPs。现在这项工作仍在继续进行。整个 SNP 分型工作将由加拿大、中国、日本、英国和美国的 10 个研究中心进行。每个中心将针对所承担的染色体对所有的研究样本进行基因分型检定。这些中心共采用了 5 种检定分型技术。项目的初期目标(至 2004 年 6 月左右)是构建出一个约由 60 万个在人类基因组中均匀分布的SNPs 构成的图谱,其 SNP 密度约为每 5000 个碱基一个位点。然后将针对需要定义单体型边界的区域进行更多的 SNP 位点的检定。分型结果的质量将通
30、过重复样本、所有中心对一组同样SNPs 进行检测、以及对一定数量的已检定结果进行不同中心的互相检测来保证。数据分析此项研究的基本数据是各人群共计 270 个样品的 SNP 等位位点的频率和基因型。为了构建单体型和选择标签 SNP 位点,本研究将采用标准的 SNP 连锁分析如 D和 r2 ,同时发展新的分析方法。因为本研究的所有数据将免费共享,其他研究者也可以用另外的手段来分析数据或是改进分析方法。 本研究产生的数据将显示常见的人类基因组遗传的多态模式,包括个体间遗传多态位点的数量,人群间具有不同单体型频率的区域和不同染色体区域 SNPs 的连锁范围。获得数据和知识产权政策 HapMap 项目将
31、向公众公布所有的实验数据,以让任何研究者利用这些信息。新的 SNP 位点、SNP 基因分型实验设计、SNP 检定结果和频率,以及构建的单体型一经产生,将很快发布。当对染色体区域进行了足够的 SNP 分型来确定紧密连锁的区域时,这些区域的单体型、个体的基因型和标签 SNPs 将无条件地公开发布。然而,对那些还没有足够分型密度数据的区域,要获得个体的基因分型结果,就要遵守数据访问政策。这项政策只有很小的约束,既使用者必须同意不能使其他人访问这些数据有所减少,同时只能与也同意这个政策的人士共享这些数据。这个暂时性的政策的唯一目的就是为了保证项目的所有数据能被公众所享有。项目完成时,任何还未发布的数据
32、都将公开。 本研究项目不包含将遗传多态性落实到表现型的有特殊利用价值的研究,如疾病易感或对药物的反应。项目的参加者认为将还未有产生特殊用途的 SNP 位点、基因型或单体型用于专利发明是不适当的。只要使用者不影响其他人获得本研究的数据,数据访问政策不阻止使用者对他们已经显示有特殊利用价值的 SNP 位点或单体型图申请专利。在数据公布以前,项目参加者不会将本项目的数据用于自己实验室的其它研究。内部数据访问政策在数据发布至 dbSNP 数据库(如 SNP 位点、SNP 检测设计、等位位点及其频率)或数据协调中心的基因型数据库(如个体的基因型和单体型)之前,国际“人类基因组单体型图计划”的参加者不能将
33、本项目的数据用于自己实验室的其它研究项目(包括他们自己产生的数据) 。国际“人类基因组单体型图计划”的参加者使用与其他使用者一样的数据访问政策。对于基因型和单体型数据来讲,也使用公众数据访问政策的协议。所有参加者已经确认他们接受与其他使用者一样的许可协议。如果没有确认的用途功能(即与表现型相关) ,项目参加者不能对本研究产生的 SNP 位点或单体型申请专利。参加者如果有功能证据或其他已确认的用途,可以对与疾病或功能相关的 SNP位点或单体型申请专利。但是,因为 HapMap 计划不含有产生功能或应用信息的研究,所以这些结果只能通过 HapMap 项目以外的研究获得。如果项目参加者想使用本计划的
34、数据进行其它研究,只能通过已对外公布的 dbSNP 库或数据协调中心的数据库获得信息。如果参加者申请了专利并获得批准,他们不能就此妨碍其他人访问 HapMap 的数据。NCBI dbSNP Genotype Server 批量下载 Genotype。NCBI dbSNP Genotype Server说明:NCBI 2006 年 8 月 29 日发布的服务,可按照 SNP 的 rs 收录号、染色体上的起始位置、基因的名称,大批量的检索Genotype,并且,返回的结果很人性化,界面很友好,可以有 html、xml 、text 和 haploview 多种格式。检索主界面:http:/www.n
35、cbi.nlm.nih.gov/projects/SNP/snp_gf.cgi帮助说明:http:/www.ncbi.nlm.nih.gov/projects/SNP/docGenotype.html使用方法:网页友好界面,用法很简单,一般有 3 步,step1、step2、step3 按照其说明向下检索即可。超过 20000 个 Genotype 的检索结果以 xml 形式发送至指定的 email。个人经验:批量下载 SNP 数据不错,可直接导入 Haploview 很方便。再找感兴趣的位点的 LD,或查找Haplotype,tSNP 等。 这个工具可以同时输入不多于 750 个 SNP 的
36、 rs,然后输出相应的 frequency 或者是感兴趣人群的所有的 genotype现在仍未解决的问题是:1.需要查询多个基因的 SNP 数据或者是 tag SNP 数据2.同时得到这些 SNP 在基因中的位置(exon/intro?),功能(synonymous/nonsynonymous?), 以及上下游的 sequence我一般下载下来用 haploview 里面的 Tagger 查找 tagSNP,或直接到 hapmap 上找tagSNP, haploview 4.0 版可以直接从 hapmap 上下载数据。好像只能一个基因一个基因的查找,或一段区域查找。NCBI 或 Ensembl
37、 都能解决你的第 2 个问题。haplview 4.0 在哪里可以下载到?还有为什么我按照你指导的批量下载 SNP 信息时候,总是只出现一个 RSxxxxxx ?要是能做一个“选择 SNP 的基本步骤”的讲座就好了! 谢谢指导!google 一下就能找到http:/www.broad.mit.edu/mpg/haploview/有三种方式,rsxxxxx 单个位点下载, Gene ID 范围下载,染色体位置范围下载,都是可以的,有不同选项的。或直接用 haploview 4.0 从 hapmap 上下载数据。=SNP 选择,不同的人有不同的看法,我也没看到很权威的标准或原则,个人觉得还没有达到
38、讲座的水平,不能误导,见谅。问:Clongene 我用 haploview 4.0 下载数据,从这个界面输入基因的染色体位置-例如:CHRNA4:chr20:6144510961463192, OK 以后,显示:no phased CEU haplotypes on chr20from 614452000 to 614632000. 但是同样的方法我找到了 SLC6A3 的一些 Tag SNP,并且查证就是在基因上。请 Clongene 帮助解答一下! 注意上面截图的 Start 和 End 的单位,是 kb,如果直接输入 61445109 和 61463192,软件最多识别前 6 位,即 6
39、14451 和 614631 并且单位是 kb,这样其实在 chr20 上没有此位置,所以就没有数据信息了。后面的错误提示信息也是显示的 chr20from 614452000 to 614632000,与你要的数据差一位数。可以将 61445 和 61463 输入试试,应该有你要的数据。按照你的建议,输入 61445 和 61463,找到了两个 SNP(但是 MAF 都小于设定的 0.1) ,于是 tagger后,没有结果。但是我在 HapMap 上,在线查找同样基因的 SNP 却有几个 TagSNP 的。所以想问问:你说查找 SNP 有几个方法,其中有在 HapMap 下载(它同时也给出
40、TagSNP 的结果) ,也可以从软件下载,挑选 TagSNP,我比较了两种方法,发现 SNP 和 TagSNP 的结果都不一致,不知道是为什么?如果我觉得一个基因的 TagSNP 数目有些少,我想再从这个基因的前后扩展区域寻找一些,通常扩展多少 bp 的碱基合适?我觉得要根据该基因与上下游序列的连锁状况来决定,如果经费较多,可以选择更多的点如果是由于后台数据的问题导致差异,是不是像上面的战友说的 在线挑选 TagSNP 更加全面?那是后台数据库不同在线可以查到更全的数据库,hapmap 数据库有很多个版本,还不断在更新,软件只能下载部分数据库,我建议还是麻烦点一点点去找吧我是在线查找一个基因
41、的所有 SNP,然后导入 haploview 挑选出 TagSNP,所以后台数据库应该是同一个。我想是不是在线选 Tag 和程序选的 Tag 有些差异,这样解释不知道是否合适?当然是库的数据越详细越全面越好,目前,HapMap、NCBI 等上面的数据可以满足绝大多数应用了,选择 tagSNP 也没有问题。据说,最全的库是 Applera 公司的 Celera Discovery System(CDS)数据库,号称公共数据库里面的数据只是他们的一小部分,前几年他们公司还推广此库,可惜价格超高,用户不多,可能只有大的制药公司等有此库,ABI 公司的系列产品也基于此库的数据。用 Haploview
42、软件时遇到的几个问题,请大家帮忙解释一下:1、定义 block 是有 4 种方法:Confidence Intervals、Four Gamete Rule、Solid Spine of LD、custom,这 4 种方法的分别在什么情况下选用。2、筛选 Tag SNP 时,有 3 种模型:pairwise tagging only、aggressive tagging:use 2-marker haplotypes、aggressive tagging:use 2- and 3-marker haplotypes,这 3 种模型分别在什么情况下选择?附图一3、Haploview 软件运行后,
43、haplotype 运行结果显示:block2 中显示 09 和 11 这两个位点均为 Tag snp,但在 tagger 运行结果中这两个位点均未被选作 tag snp,我们在选择 tagsnp 是应根据那个结果做选择?看过之前的帖子上说的,该软件有两种选择 tagsnp 的方法,一种是挑选可以代替人群中常见单体型的位点,另一种是挑选可以代替常见 SNP 位点的位点,可以这样理解吗,haplotype 运行结果挑选的是可以代替人群中常见单体型的位点,tagger 运行结果挑选可以代替常见 SNP 位点的位点吗?谢谢! 用这款软件时有个空空要填 start kb 和 end kb 的,那个怎么
44、填写啊,依据什么,除了直接 RUN TAG 出来 img/img的结果,选择 TAG SNP 还要注意什么呢?感谢前辈指教。 你要从 Hapmap 当数据,当然要根据你的目的找到你要画图的开始和结束位置了。如果你要画 Gene 的,直接在 Hapmap 主页输入 Gene 的名字,就可以看到开始和结束的位置了 tagging algorithm 指的是什么?是什么公式啊?这是我投稿后审稿人给的我修稿意见。他的意思是让我从这几方面描述如何选择 tagging SNPs:A better description is needed that includes the tagging algorithm, the LD(r2) cut-off and the version of the HapMap CHB reference data used你说我怎么说呢?还有,我是不是得用 Hapmap phase II genotype data?