全基因組關聯分析 GWAS (Genome-wide association study)
應用基因組中數以百萬計的單核苷酸多态;SNP為分子遺傳标記,進行全基因組水準上的對照分析或相關性分析,通過比較發現影響複雜性狀的基因變異的一種新政策
1、關聯分析模型
一般線性模型(GeneralLinear Model):y = Xα + Zβ + e
混合線性模型(Mixed Linear Model):y = Xα+ Zβ + Wμ+ e
y:所要研究的表型性狀;
Xα:固定效應(FixedEffect),影響y的其他因素,包括群體結構、性别、年齡等因素;
Zβ:标記效應(MarkerEffect);
Wμ:随機效應(RandomEffect),這裡一般指個體的親緣關系。
2、關聯分析統計方法
Bayes:Bayes A、Bayes B、Bayes C、Bayes Cpi
統計軟體:GenSel、GenABEL,均為R程式包。
CMLM (Compressed Linear Mixed Model)
統計軟體:GAPIT、TASSEL
EMMAX (Efficient Mixed Model Association)
統計軟體:emmax
GBLUP(Genomic Best Linear Unbiased Prediction):專門用于Genomic prediction
統計軟體:ASReml
3.數量性狀
指個體間表現的差異隻能用數量來差別,變異呈連續性的性狀。它具有兩個主要特征:變異呈連續性,變異易受環境條件影響。其主要特征有:①個體間差異很難描述,需要度量;②在一個群體中,變異呈連續性;③數量性狀常受多基因控制;④數量性狀對環境影響敏感
4.品質性狀(discrete characters )
指屬性性狀,即能觀察而不能量測的性狀,是指同一種性狀的不同表現型之間不存在連續性的數量變化,而呈現質的中斷性變化的那些性狀。按所屬學科不同有三項不同定義。在單基因遺傳病中,基因型和表現型之間的對應關系較為明顯,是以這一性狀的變異在群體中的分布往往是不連續的,可以明顯地分為2~3群,是以單基因遺傳的性狀也稱品質性狀。
5.Hardy-Weinberg equilibrium (HWE)
在理想狀态下,各等位基因的基因頻率以及基因型頻率在遺傳中是穩定不變的,即保持着基因平衡。
HWE有助于确定有明顯基因分型錯誤的SNPs,是以要求位點SNP的等位基因頻率符合哈代-溫伯格平衡。
6.QQ plot的圖形解讀