天天看點

GWAS 基本概念

全基因組關聯分析 GWAS (Genome-wide association study)

應用基因組中數以百萬計的單核苷酸多态;SNP為分子遺傳标記,進行全基因組水準上的對照分析或相關性分析,通過比較發現影響複雜性狀的基因變異的一種新政策

1、關聯分析模型

一般線性模型(GeneralLinear Model):y = Xα + Zβ + e

混合線性模型(Mixed Linear Model):y = Xα+ Zβ + Wμ+ e

y:所要研究的表型性狀;

Xα:固定效應(FixedEffect),影響y的其他因素,包括群體結構、性别、年齡等因素;

Zβ:标記效應(MarkerEffect);

Wμ:随機效應(RandomEffect),這裡一般指個體的親緣關系。

2、關聯分析統計方法

Bayes:Bayes A、Bayes B、Bayes C、Bayes Cpi

統計軟體:GenSel、GenABEL,均為R程式包。

CMLM (Compressed Linear Mixed Model)

統計軟體:GAPIT、TASSEL

EMMAX (Efficient Mixed Model Association)

統計軟體:emmax

GBLUP(Genomic Best Linear Unbiased Prediction):專門用于Genomic prediction

統計軟體:ASReml

3.數量性狀

指個體間表現的差異隻能用數量來差別,變異呈連續性的性狀。它具有兩個主要特征:變異呈連續性,變異易受環境條件影響。其主要特征有:①個體間差異很難描述,需要度量;②在一個群體中,變異呈連續性;③數量性狀常受多基因控制;④數量性狀對環境影響敏感

4.品質性狀(discrete characters )

指屬性性狀,即能觀察而不能量測的性狀,是指同一種性狀的不同表現型之間不存在連續性的數量變化,而呈現質的中斷性變化的那些性狀。按所屬學科不同有三項不同定義。在單基因遺傳病中,基因型和表現型之間的對應關系較為明顯,是以這一性狀的變異在群體中的分布往往是不連續的,可以明顯地分為2~3群,是以單基因遺傳的性狀也稱品質性狀。

5.Hardy-Weinberg equilibrium (HWE)

在理想狀态下,各等位基因的基因頻率以及基因型頻率在遺傳中是穩定不變的,即保持着基因平衡。

HWE有助于确定有明顯基因分型錯誤的SNPs,是以要求位點SNP的等位基因頻率符合哈代-溫伯格平衡。

GWAS 基本概念

6.QQ plot的圖形解讀

GWAS 基本概念