天天看点

GWAS 基本概念

全基因组关联分析 GWAS (Genome-wide association study)

应用基因组中数以百万计的单核苷酸多态;SNP为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略

1、关联分析模型

一般线性模型(GeneralLinear Model):y = Xα + Zβ + e

混合线性模型(Mixed Linear Model):y = Xα+ Zβ + Wμ+ e

y:所要研究的表型性状;

Xα:固定效应(FixedEffect),影响y的其他因素,包括群体结构、性别、年龄等因素;

Zβ:标记效应(MarkerEffect);

Wμ:随机效应(RandomEffect),这里一般指个体的亲缘关系。

2、关联分析统计方法

Bayes:Bayes A、Bayes B、Bayes C、Bayes Cpi

统计软件:GenSel、GenABEL,均为R程序包。

CMLM (Compressed Linear Mixed Model)

统计软件:GAPIT、TASSEL

EMMAX (Efficient Mixed Model Association)

统计软件:emmax

GBLUP(Genomic Best Linear Unbiased Prediction):专门用于Genomic prediction

统计软件:ASReml

3.数量性状

指个体间表现的差异只能用数量来区别,变异呈连续性的性状。它具有两个主要特征:变异呈连续性,变异易受环境条件影响。其主要特征有:①个体间差异很难描述,需要度量;②在一个群体中,变异呈连续性;③数量性状常受多基因控制;④数量性状对环境影响敏感

4.质量性状(discrete characters )

指属性性状,即能观察而不能量测的性状,是指同一种性状的不同表现型之间不存在连续性的数量变化,而呈现质的中断性变化的那些性状。按所属学科不同有三项不同定义。在单基因遗传病中,基因型和表现型之间的对应关系较为明显,因此这一性状的变异在群体中的分布往往是不连续的,可以明显地分为2~3群,所以单基因遗传的性状也称质量性状。

5.Hardy-Weinberg equilibrium (HWE)

在理想状态下,各等位基因的基因频率以及基因型频率在遗传中是稳定不变的,即保持着基因平衡。

HWE有助于确定有明显基因分型错误的SNPs,因此要求位点SNP的等位基因频率符合哈代-温伯格平衡。

GWAS 基本概念

6.QQ plot的图形解读

GWAS 基本概念