全基因组关联分析

  • 常见问题
  • 产品介绍

常见问题





GWAS所需的样本数是多少?

原则上样本数越多越好,目前GWAS产品建议样本数在200个以上。


样本选择的标准?

1、样本数量:原则上样本数量越多越好,质量性状要求的样本数目小于数量性状,主效基因控制控制的数量性状小于微效基因控制的数量性状。自然群体大小至少200个样品。

2、材料的选取是影响后续分析结果的重要因素,总结文献及项目经验,建议材料选择参考如下原则:

a、原则上样本间不能有明显的亚群分化(例如生殖隔离等)即遗传背景差异小;如果样本间存在亚群分化,则每个亚群建议样本量在200个以上;

b、主要为自然群体,群体来源广泛、遗传多样性丰富:可以根据研究性状需求,在各地 区进行取材,保证群体来源广泛,可在全球范围内收集种质资源,也可在国内各省份收集,详细的采样策略可参考下表。

c、样本数不少于200个:在全基因组关联分析中,原则上样本数目越多越好。参照文献 报道以及项目经验,建议样本数不少于200个。

3、表型性状:目标性状选取建议选择遗传力高的性状。性状的表型记录越清楚越有利于后期的分析,表型的鉴定可参考如下原则:

a、所有个体的性状表型鉴定部位尽量保持一致,如鉴定果实成熟时全部取植株中部果实;

b、尽量使所有个体在同一环境中进行表型鉴定,建议利用多年或者多点进行表型鉴定以 消除环境对表型的影响;

c、表型记录准确;

d、如材料难以满足上述鉴定条件,可以估算个体表型育种值作为表型值;

e、若无法进行多年多点表型鉴定,则需要保证数据一定记录准确和完整。


是否需要多年多点的表型鉴定实验消除环境对表型的影响?

建议进行多年多点表型鉴定实验。动植物的表型性状由基因型(G)、环境效应(E)共同作用。即非遗传因素(不同的实验环境)对表型有一定的影响,是需要考虑的。研究者可以基于一定的统计方法来降低这种环境差异对表型造成的影响:
1. 可以将单年的表型数据分别进行分析,最后比较结果并汇总;
2. 将多年多点的表型数据进行育种值计算再进行全基因组关联分析。


研究其中一个性状所需的样本数建议是多少?

建议是单一性状的样本支持数在200个以上,同一个体可对其多个性状进行研究,因此研究多个性状时总样本数不要求是性状数x200。


为什么推荐≥5X的测序深度?

研究人员对测序深度对GWAS结果的影响进行了评估。结果显示,当测序深度为2X,样品基因分型的检出一致性在90%以上,当测序深度为4X的时,为96%以上,6X时98%以上。此外,当测序深度达到5X时,个体的1X覆盖度达到90%以上,满足后续GWAS的分析需求,而当测序深度达到7X以上,个体1X覆盖度达到95%以上,不进行缺失推断即可满足分析需求。综合考虑项目的成本及结果准确度,建议的测序深度≥5X。


不同性状可在一个个体上交叉吗?

不同性状可在同一个个体上交叉,如以株高和颜色性状划分群体,两个群体间会有重叠的个体存在,不影响分析的结果。

全基因组关联分析

全基因组关联分析是应用基因组中数以百万计的单核苷酸多态性(SNP)为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。



  • 电话:400-178-8899
  • 邮箱:support@kaitaibio.com
  • 地址:浙江省杭州市西湖区金蓬街358号青蓝科创园C座3号楼6楼

杭州开泰生物技术有限公司备案号:浙ICP备17059463号-1