1、 By 杂z 交jio粳jng稻do2012-1-12 根据目的不同,图示基因型有两种常见的制作方法。 一、使用软件 GGT。使用方法可以查看 Menu,当然这里还是要简要介绍一下的。 这种方法通常用于查看作图群体,比如 RIL,F2 的图示基因型。其中的染色体/连锁群的长度是根据你所使用的标记构建的连锁群确定的,与染色体实际的长度并不同。下面以水稻为例介绍。 1,打开 GGT软件,首先弹出下面这个窗口。这时你可以打开已经做好的.ggt 格式的文件,查看图示基因型。也可以制作.ggt 格式的文件。一下内容主要介绍.ggt 格式文件的制作。 2,打开“file”,选择其中的“Build GGT
2、file”。弹出下面的窗口。 3,点击“Load marker maps”,输入 map 文件。Map 文件格式如下: Map 文件实际就是染色体的信息,标记及其对应的遗传距离的信息。在 txt 文档中保存,然后把后缀名改成 map 就行啦。 4,这时原来灰色显示的“Load Locus data”变的可选,点击它,输入.loc 文件。Loc 文件格式如下: Loc 文件其实就是你跑胶的结果。 5,点击“Merge data”,.ggt 文件就做好了。然后保存就可以啦。输出的.ggt 文件如下: 6,用 GGT 软件打开就可以浏览这个群体的图示基因型了。 二,手工制作图示基因型 下面介绍一种适
3、用于 NIL 或其他类似用途的图示基因型做法。 这种方法做出的图示中染色体的长度可以由你自己定,通常我们根据染色体的实际大小来做。下面仍然以水稻 NIL 为例。假设这个 NIL 的 8 号染色体的 50cM 出有个目标基因。我们需要做的就是把这个位点在 12 条染色体中表示出来。 1, 确定染色体的长度。水稻各条染色体的长度如下:(大致的长度) Chr 1 2 3 4 5 6 7 8 9 10 11 12 cM 181.8 157.9 166.4 129.6 122.3 124.4 126.3 118.6 121.2 93.5 83.8 109.5 2,打开 EXCEL,规定 1 个小格为 1
4、0cM。当然你也可以规定 1 个小格为 1cM。这个主要根据需要而定。很明显,一个小格代表的遗传距离越小,做出的图示基因型越精确。对于 1 号染色体 181.8 的长度,我们就需要 18 个小格就可以啦。各染色体以此类推。 其中有一个要注意的是每条染色体都有两条染色单体,因此我们在制作的时候每天染色体都用两列。由于除 8 号染色体外都不需要目标标记,因此 8 号染色体以外的其他 11 条染色体就可以合并单元格了。如下图。 3, 由于 8 号染色体 50cM 出有个目标标记,因此我们在 8 号染色体的第 5 个小格处把背景改成黑色。其他部位就可以合并单元格了。如下图。 4, 现在把各条染色体分开
5、。每条染色体之间插入列就行啦。为了美观,把代表染色体的单元格的宽度调为 2.如下图。 5, 把代表染色体的单元格的背景改成粉色,染色体之间的单元格合并,同时把染色体的名字去掉。(这一步纯属美观)如下图。哎呀,还要记得把代表染色体的单元格的边框变成实线哦。这一步最好在第 4 步做。我也懒得修改啦。哈哈。 6, 现在图示基因型已经初见端倪啦。似乎不美观。如果你把列宽调成 0.92,你会有惊奇的发现。 接下来做的就是用截图工具把这个粗糙的图示基因型剪下来,在作图工具(windows 附件里的“画图”工具就行)中把虚线涂掉就可以啦。 最后的效果图如下。 structure 软件的作用:分析一个品种个体
6、分成几个亚群类似分成几个亲缘关系的群体。目的是将一个品种的所有单株分成几个亚群 structure 软件:(防止出现假阳性:只用分子数据)Q 值将个体Q 作为协变量(回归系数)Tassel2.0 软件:用表型数据和分子数据,GLM 回归方程式ai= :选择优异的等位变异, 为优异(关联标记)后,利用所有该带型的植株的性状平均值减去所有不含该带型的植株的平均性状值,正值为优异 的。 关联分析structure软件的使用步骤: 一、file new projectstep1 name the project 自定 ,目录(文件夹)准备存放位置打开(数据)文件(固定格式) step2 个体数(群体)
7、倍性为 2 标记数缺失的带写 9 step3 选第一个:用行表示标记的名称(excel 格式中行为标记名称) step4 都不选,直接点 finish点 proceed,后出现数据框。 二、点 parameter set(参数设置) newrun length 1、50000 2、100000 这是习惯设置,可自行设置,但不能小于 50000ancestry model 选use admixture model(混合模型)allele frequency model 选第二个(independence,独立的等位基因的频率)advanced 选第一个(compute)ok自己设定(一个参数设定
8、名称) 三、点 projectstart a job 选中所要运行的数据(前面输入的) 填写 stepKfrom2 到10可写5 到 20 start,开始运行 四、点 view 选 simulation summary 结果中:parameter set:参数名称 Run name:运行名称 只看 P(D)列,在该列中选最大值,后根据(run name 的号,即 K值)打开结果文件(用写字板格式打开) 看 Q 值:把 miss 列(指缺失标记数)与“:”列去掉,后面向前移,Q 值为矩阵,复制到 excel 中后转化为 txt(注意,其中的间隔要用tab 键,不要用空格键),将 Q 值存成 t
9、xt 格式,将其命名为 Pop structure.txt(自定)。 在 structure 软件中的格式: 转成 txt 后将 A 列删掉 最大化点 poly:打开 diaploid SSR 工作表(分子数据与前structure 软件格式不一样) 群体数 95 标记数 93 点左侧栏:genotype点工具栏 A:a Genotype选最下面 eg A:aAa在左侧栏出现Genostates(I基因型状态),选中点工具栏中 trait选 six traits .txt左侧栏 phentypes 出现6 traits/envivonII , 选中 点工具栏 pop选 pop structur
10、e.txt 打开左侧栏 pop structure 下出现6element QIII同时选中I II III,点join,后在左侧栏 fusions 列中出现I+ II+ III,选中I+ II+ III,后点工具栏 analysis,再点 GLM,若有多个 Q 值时,则前面全选 covariate,最后一个选 exclude,性状全选 data选 define output选define ftests中的marker residnal 0将permutation 的 0 值改为 1000,结果为表型变异结实率,点左侧栏:I+ II+ III(选左栏 association 中的I+ II+ III)将数据导出点,resulttableexport(Tab)命名,后用 excel 打开该文件:最后一列为贡献率;p-marker:支持连锁不平衡的概率。 LD图的做法:点genstates(左侧栏) 选左侧栏LD栏的LD:diploidresultLDplotsave JPG