天天看點

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

目錄

  • ​​一、來源​​
  • ​​研究一:Draft genome sequence of adzuki bean, Vigna angularis​​
  • ​​研究二:Genome sequencing of adzuki bean (Vigna angularis) provides insight into high starch and low fat accumulation and domestication​​
  • ​​二、研究一(小豆基因組草圖)​​
  • ​​基因組組裝​​
  • ​​基因與重複序列預測​​
  • ​​小豆馴化痕迹​​
  • ​​标記開發及育種應用​​
  • ​​紅豆基因組進化​​
  • ​​三、研究二(小豆高澱粉低脂肪積累與馴化)​​
  • ​​基因組測序群組裝​​
  • ​​重複序列分析和基因預測​​
  • ​​基因家族與其他已測序豆科植物基因組的比較​​
  • ​​基因組複制和共線性分析​​
  • ​​澱粉和脂肪酸生物合成和代謝基因​​
  • ​​多樣性和馴化分析​​
  • ​​結論​​

一、來源

2015年發表的兩篇紅小豆文章。

研究一:Draft genome sequence of adzuki bean, Vigna angularis

Kang, Y., Satyawan, D., Shim, S. et al. Draft genome sequence of adzuki bean, Vigna angularis. Sci Rep 5, 8069 (2015). ​​https://doi.org/10.1038/srep08069​​

機關:Seoul National University

和2014年綠豆那篇同一個團隊,分析套路類似。

紅豆 ( Vigna angularis var. angularis ) 是一種二倍體豆科作物 (2n = 2x = 22),估計基因組大小為 538 Mb ​​1​​。它是角豆亞屬中的亞洲豇豆之一,屬于豆科​​2​​​的蝶形亞科。紅豆因其甜味以及營養豐富的蛋白質和澱粉含量而在中國、日本和南韓等東亞國家廣泛種植,作為傳統甜點美食的原料。中國、日本、北韓半島和台灣的紅豆年種植面積估計分别為 670,000、120,000、30,000 和 20,000 公頃​​3​​。小豆野生種,如V. angularis變種 nipponensis、V. nakashimae和V. nepalensis廣泛分布于東亞和喜馬拉雅山國家​​2​​。然而,考古證據表明東北亞有多個馴化起源。小豆V. angularis var. angularis是綠豆V. radiata 的近親,适應亞熱帶和溫帶氣候區。

研究二:Genome sequencing of adzuki bean (Vigna angularis) provides insight into high starch and low fat accumulation and domestication

Kai Yang,Zhixi Tian,Chunhai Chen, et al. Genome Sequencing of Adzuki Bean (Vigna angularis) Provides Insight into High Starch and Low Fat Accumulation and Domestication . ​​DOI:10.1073/pnas.1420949112​​

機關:北京農學院教授萬平,中國科學院遺傳與發育生物學研究所研究員淩宏清和田志喜,深圳華大基因研究院

紅豆 ( Vigna angularis var. angularis ) 約 12,000 年前在中國馴化 ( ​​1​​​ ) 并在世界 30 多個國家種植,特别是在東亞 ( ​​2​​​ , ​​3​​​ )。紅豆種子是蛋白質、澱粉、礦物質元素和維生素的重要來源 ( ​​4​​​ , ​​5​​​ )。由于其熱量和脂肪含量低,蛋白質易消化,生物活性化合物豐富,紅豆被稱為“減肥豆”(​​6​​​ , ​​7​​​)。鑒于這些特性,紅豆被廣泛用于各種食品(例如,糕點、甜點、蛋糕、粥、紅米、果凍、紅豆牛奶、冰淇淋中的糊狀物)至少為 10 億人提供 ( ​​8​​​ )。此外,紅豆是一種傳統藥物,在中國已被用作利尿劑和解毒劑,并緩解水腫和腳氣病的症狀 ( ​​9​​​ , ​​10​​ )。

小豆适應性廣,對貧瘠土壤的耐受性強,是一種高價值輪作作物,有助于通過固氮改善土壤條件( ​​11​​​ , ​​12​​ )。此外,紅豆可以用作模型物種,特别是對于非油籽豆類,由于其生長期短且基因組小的特點。

二、研究一(小豆基因組草圖)

基因組組裝

流式分析基因組大小估計為 612 Mb,高于先前估計的 538 Mb 。22 k-mer 估計基因組大小為 591 Mb。

測序材料是 Gyeongwon,在南韓廣泛種植的品種。

多種大小片段文庫,ALLPATHS-LG + Newbler組裝,3883個scaffold,N50=703kb,總長443Mb(75%)。通過從 Ks 頻率圖的峰值中尋找與菜豆Phaseolus vulgaris和綠豆V. radiata var. radiata的共線性區塊,并提取保守基因組區塊,用作superscaffold橋梁。基于共線性的scaffold政策将 N50提高到1.5Mb,最長從4.4Mb提高到11.1Mb。

通過GBS将133個F4群體(Gyeongwon和野生種IT178530雜交後代)來自建構遺傳圖譜,過濾後的 814 個 SNP用于建構11個連鎖群,共158個scaffold錨定到11條假染色體上,大小為210Mb,N50=25Mb。

基因與重複序列預測

mRNA的花、莢、葉、根組織,Trinity從頭組裝,Maker流程。

CEGMA評估248個核心基因>86%,與大豆、綠豆、菜豆(P. vulgaris)的基因長度、CDS和内含子等元件比較。小豆的短基因(250bp)比例更高。26857個基因中15,976 個位于假染色體上。

小豆與拟南芥、水稻、大豆、蒺藜苜蓿(M. truncatula)的蛋白聚類分析:共有的 6,643 個基因簇,小豆特有1,163 個基因簇。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

小豆與大豆、綠豆、菜豆的共線性分析。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

在紅豆基因組中總共鑒定了 2,669 個編碼轉錄因子 (TF) 的基因。将相對 TF 豐度與其他植物基因組的豐度進行了比較,發現這些植物基因組中 TF 基因家族的總體比例相似。

基于同源性和結構的分析顯示約 43.1% 的已測序小豆基因組為重複序列。

小豆馴化痕迹

馴化特征:種子破碎、種子休眠最小化以及種子大小和數量增加。

新增測序材料,小豆野生近緣種V. nepalensis(AusTRCF85148)和V. angularis var. nipponensis(IT241912)。包括之前研究材料IT178530的reads。比對到小豆參考基因組上進行變異檢測。

通過栽培和野生紅豆的直系同源比較,我們計算了每個非同義位點的非同義替換數(Ka)與每個同義位點的同義替換數(Ks)的比值,以估計每個基因的選擇壓力。V. angularis var. nipponensis在 Ka/Ks 計算中顯示出最少數量的多态性基因 (1,823)。我們在 Ka/Ks 值為 0.2 時觀察到一個一緻的峰值,表明栽培和三種野生紅豆之間存在純化選擇(Ka/Ks < 1)。

三個材料的Ka/Ks 分布高度相似,一緻顯示三個峰(0.2、0.5 和 0.7 ~ 0.8)。在這兩個比較中,分别在三個峰内共同發現了總共 307、152 和 75 個基因表明栽培和野生紅豆之間對這些位點的選擇壓力不同。

盡管 Ka/Ks 小于 1 已被解釋為純化選擇的特征​​27​​,但每個峰中的基因子集可以作為解釋野生和栽培小豆之間差異的候選基因。例如,在第二(0.40.6)和第三個峰(0.60.9)的病害相關基因的同源物如Vang03g15160、Vang02g14420、Vang0291s00070、Vang0229s00140、Vang02g144等野生豆類都可能具有不同的抗病性。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

标記開發及育種應用

使用 MISA 軟體确定了簡單序列重複 (SSR) 标記。總共檢測到 143,113 個 SSR,三重複單元 SSR(基因分型的首選類型)的數量為 1,941。使用翻譯基因組學方法​​29​​​預測了這些 SSR 标記的相關 QTL 。翻譯了大豆的 2,010 個 QTL 相關 SSR 标記的基因組位置通過 569 個直系同源塊将小豆的基因組位置對應到到大豆相應的基因組位置,并将農業上重要的 QTL,如開花時間、成熟度、種子大小、産量和抗病性繪制到circos上。

抗病性 QTL 可能圍繞 87 個編碼核苷酸結合位點 (NBS) 和富含亮氨酸重複序列 (LRR) 域的基因,它們通常與抗病性相關。這些翻譯的 QTL 的側翼标記可用于育種計劃。

紅豆基因組進化

使用菜豆P. vulgaris、綠豆V. radiata、野生小豆V. nakashimae、野生小豆V. nepalensis、小豆V. angularis var. 的60 個直系同源物建構進化樹。

小豆形成了一個獨特的進化枝(包括野生小豆)。栽培和野生小豆之間的最小物種形成時間為 0.05 MYA,這早于小豆種植的考古證據(約 5,000 年之前)。

Ks密度圖顯示這些物種具相同的單個古全基因組複制(~53.3 MYA),在紅豆基因組中鑒定了 1,273 個串聯複制基因,GO富集在防禦反應,氧化還原和磷酸化,這與在其他植物基因組發現是一緻的。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

三、研究二(小豆高澱粉低脂肪積累與馴化)

基因組測序群組裝

材料:中國品種“京農6号”,49份小豆重測序(11個野生,11個半野生,17個地方種,10個栽培種)。

90.88 Gb 高品質序列(168 × 小豆基因組覆寫率),Kmer評估542Mb, SOAPdenovo 組裝 ,contig N50=38 kb ,scaffold N50=1.29 Mb,大小466.7 Mb(86.11%)。GC含量為34.8%,與其他已測序的豆科植物基因組相似。

使用來自栽培品種 Ass001 雜交的150 個F2個體,通過RAD-Seq建構了高密度單核苷酸多态性 (SNP) 遺傳圖譜。遺傳圖譜由覆寫 11 個連鎖群的 1,571 個 SNP 組成,跨越 1,031.17 cM,每個scaffold平均有 4.33 個映射的 SNP,平均标記距離為 0.67 cM。總共長度有372.9 Mb 的scaffold通過使用這些SNP 配置設定給 11 個假染色體(79.9%)。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015
A:重複基因;B:染色體;C:連續200kb視窗的GC含量;D:重複序列密度;E:基因密度;F:表達基因密度;G:SSR密度;H:SNP密度。

重複序列分析和基因預測

約44.51% (207.7 Mb) 的紅豆基因組由重複 DNA 組成。高于苜蓿和蓮花,低于大豆、鷹嘴豆和木豆,但與普通豆(菜豆)相似。與其他豆科植物基因組一緻,大多數轉座子是逆轉錄轉座子(占基因組的 34.57%),而 DNA 轉座子僅占基因組的 5.75%。使用MISA鑒定 16,230 個簡單序列重複 (SSR),設計了 9,038 個 SSR 引物對,通過分析 1,572 對引物發現其中 24.7% 表現出多态性,可作為遺傳标記。

RNAseq資料包含 三個不同發育階段(開始、發育和成熟種子)的根、莖、葉和種子,轉錄組組裝由59,909個unitranscripts組成,其中97.4%被基因組組裝覆寫,92.6%被捕獲在一個超過90%的unitranscript長度的支架中,進一步證明了基因組組裝的高品質。

結合從頭基因預測、基于同源性的搜尋和 RNA-Seq 來預測小豆基因組中的基因模型,共預測了 34,183 個蛋白質編碼基因。

基因家族與其他已測序豆科植物基因組的比較

與其他六個已測序的豆科植物基因組相比,小豆基因組中預測基因的數量低于大豆、木豆和紫花苜蓿,但高于普通豆、鷹嘴豆和蓮花。根據基因序列占全基因組的比例(基因總長度/基因組大小),紅豆的比例(22.98%)高于除苜蓿外的其他豆科植物。

共76,211 個基因家族進行了聚類。發現5個豆科植物基因組共有12,582個基因家族(直系同源),而包含5,446個基因的827個基因家族是小豆特有的。功能主要富集在鋅離子結合、蛋白水解、半胱氨酸型肽酶活性、雙組分反應調節活性和有絲分裂等類别上。

紅豆中的單拷貝基因直系同源物明顯多于大豆,與木豆、鷹嘴豆和普通豆中的相似,而多拷貝直系同源物與此相反。紅豆和大豆之間的這種差異很可能與大豆中額外的全基因組重複 (WGD) 相關。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

通過與已知轉錄因子的序列比較和搜尋已知的 DNA 結合域,總共鑒定了 屬于 63 個家族的3,508 個紅豆轉錄因子基因。這些基因占紅豆總預測基因的10.26%,遠低于普通豆、大豆和蓮花中的比例,但與其他已測序豆類物種中的比例相似。

此外,還分析了小豆基因組中編碼R蛋白的基因,并将其與其他豆科植物進行了比較。共檢測到421個含有NBS或LRR結構域的基因,顯著低于大豆和普通豆。然而,紅豆基因組中的 CC_NBS 基因明顯多于大豆。這些資訊應該有助于确定導緻植物病害和抗病育種的基因。

小豆豆味很低,含有易消化的蛋白質和豐富的生物活性化合物。是以分析了小豆等已測序豆科植物中與黃酮類生物合成、脂氧合酶(LOX)和胰蛋白酶抑制劑相關的基因,未觀察到基因數比(基因組中基因數/總基因數)的顯著差。但是,當檢查導緻大豆中豆腥味的LOX基因表達時,發現它們在小豆中的轉錄量明顯低于大豆中的轉錄量,這些結果解釋了小豆的低豆味。

豆科植物凝集素廣泛分布于豆科植物中,是一種蛋白質毒性因子,與紅細胞表面的糖蛋白互相作用,使紅細胞凝集,是抑制動物生長、影響營養價值和營養的主要抗營養因子。大豆中的凝集素含量高,而紅豆中的凝集素含量低。我們發現小豆中豆科植物凝集素基因的基因數量比顯著低于除鷹嘴豆以外的其他已測序豆科植物物種。相對應的,小豆中的凝集素基因表達量顯著低于大豆,尤其是Le1(大豆 (gmx:100818710)中一種重要的凝集素基因)。表明Le1可能在大豆種子凝集素積累中起主要作用。

分析七種豆科植物和拟南芥中的基因家族擴充和收縮。8 個物種的所有 26,120 個基因家族中,在從普通豆形成後的 1400 萬年期間,紅豆中分别有5.39%(1,407)和 7.83%(2,046)的基因大幅擴增和收縮,而大豆比普通豆和小豆具有更多的擴張基因家族,表明大豆在基因家族中具有普遍的擴張性,與其較大的基因數量一緻。紅豆擴張基因家族中的基因GO功能富集在鋅離子結合、蛋白水解、半胱氨酸型肽酶活性、内肽酶活性、内肽酶抑制劑活性、脂質結合和脂質轉運;收縮基因家族富集在在蛋白絲氨酸/蘇氨酸激酶活性、蛋白激酶活性、蛋白酪氨酸激酶活性和防禦反應。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

基因組複制和共線性分析

通過直系同源搜尋,在小豆基因組中檢測到總共 1,501 個重複的共線性區塊,基因數從 6 到 103 不等,平均為 11.7。四重簡并第三密碼子轉換位點(4DTv)的核苷酸多樣性在小豆基因組中顯示出一個清晰的峰(4DTv∼0.36),與鳳蝶科的全基因組重複(WGD)事件一緻。我們沒有确定在大豆中發現的最近 WGD (4DTv∼0.056) 的峰值,表明小豆與大多數已測序的豆類一樣,沒有這種甘氨酸特異性事件。進一步的系統發育分析表明,小豆從19.0-32.5萬年前與木豆分歧,與大豆在16.9-29.0萬年前,與菜豆在~5.6-15.0萬年前。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015
七種豆類系統發育。A:系統發育樹和分化時間,拟南芥為外群分類群;B:小豆、普通都和大豆基因組中4DTv 距離的分布。

共線性分析表明,與其他豆科植物相比,小豆與普通豆具有更高的保守性。小豆和普通豆的大部分染色體能夠比對(例如,小豆2号染色體和普通豆7号染色體,小豆5号和普通豆5号染色體,小豆1号和普通豆3号染色體,以及小豆4号和3号染色體菜豆染色體9)。然而,紅豆的一些染色體與普通豆的不止一條染色體比對,表明物種形成後兩個基因組中發生了染色體重排。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

對紅豆和大豆也進行了共線性比較。結果表明,每條紅豆染色體都與大豆的幾條染色體相比對,表明物種形成後發生了更多的排列,這可能是最近大豆獨立WGD的結果。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

澱粉和脂肪酸生物合成和代謝基因

豆科植物是第二重要的作物科,根據種子中的儲存化合物分為油類和非油類。紅豆是典型的無油豆類,而大豆屬于油類。與大豆相比,小豆種子含有更多的澱粉(57.06% vs. 25.3%)和更少的粗脂肪(0.59% vs. 22.5%)。為了研究這種差異背後的基礎,我們分析了與澱粉和油生物合成相關的基因。

使用水稻中的澱粉生物合成基因作為查詢序列,我們在紅豆和大豆基因組中進行了直系同源搜尋。紅豆中發現的澱粉生物合成基因少于大豆(27 vs. 46),但χ 2檢驗結果表明,澱粉生物合成基因的比例(澱粉合成基因的數量) /總基因數)在這兩個基因組之間沒有顯著差異。在 2013 年和 2014 年收集了兩個生物學重複的兩個物種的三個種子發育階段(開始、發育和成熟種子)檢查了這些基因的轉錄活性。發現小豆種子成熟期澱粉生物合成基因的總轉錄量和單個澱粉合成基因的平均轉錄量均顯著高于大豆。但在種子發育的兩個早期階段沒有觀察到顯著差異。另外,澱粉合成基因的轉錄在小豆連續增加,特别是在成熟種子的階段,而這些基因在大豆中的發育和成熟階段卻降低了。

随後,我們在小豆和大豆基因組中尋找與質體中脂肪酸合成、油的合成和儲存以及脂肪酸降解相關的基因。盡管在大豆中發現的基因多于紅豆,但基因拷貝數相對于兩個基因組的總基因數沒有顯着差異。在質體中有關的脂肪酸合成的基因的轉錄和油的合成和儲存均明顯高于大豆高于小豆。我們還發現兩類基因表現出差異表達模式。與質體中脂肪酸合成相關的基因在紅豆和大豆的早期發育階段都表現出較高的轉錄水準,而油合成和儲存基因的表達在大豆中保持不變,但在後期在紅豆中表達減少。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015
紅豆和大豆種子三個發育階段澱粉生物合成( A )、質體中脂肪酸合成( B )、油的合成與貯藏( C )、脂肪酸降解( D )相關基因的轉錄量。

基于這些結果,推測大豆和小豆之間澱粉和油脂合成相關基因的轉錄量是導緻兩個物種澱粉和脂肪含量差異的原因。未來對不同物種的詳細比較基因組分析将有助于回答潛在的機制。

多樣性和馴化分析

半野生紅豆的遺傳基礎存在争議,尚不清楚半野生紅豆是與栽培種或野生紅豆密切相關還是屬于地方品種。

49個種質基因組的測序深度5.3×—27.34×。共鑒定了 5,539,411 個 SNP。

鄰接法構樹,11 個野生種質清楚地聚集在一個組中,而其餘 39 個種質,包括半野生種質、地方品種和改良品種,則被分成另一個組。11 個半野生種質分布在地方品種和改良品種之間。

【豆科基因組】小豆(紅豆)adzuki bean, Vigna angularis基因組2015

結果表明,半野生紅豆與栽培種紅豆的關系比野生型小。主成分分析表明,半野生紅豆與地方品種和改良品種的關系比野生紅豆更密切。群體結構顯示出三種類型被分成三組時,K=3沒有明顯的混合。基于所有這些綜合分析,半野生紅豆似乎是一種獨特的生态型,作為栽培種的祖先 ,而不是從古老的栽培品種和野生品種與栽培品種之間雜交的衍生物中逃脫。是以,我們在以下選擇分析中将半野生紅豆歸類為地方品種。

地方品種和栽培品種之間檢測到的選擇壓力明顯低于野生和栽培品種之間的選擇壓力,地方種和栽培種之間的選擇壓明顯低于野生和栽培種之間的選擇壓,如紅豆 1 号染色體的Fst值(上圖 D)。結果表明,從野生種質到栽培品種的馴化是徹底和連續的。選擇區域中的基因主要富集在植物與病原體互相作用、植物激素信号轉導、氨基苯甲酸降解、細胞周期和葉酸生物合成的 KEGG 途徑中。

結論

獲得了高品質的小豆基因組序列草圖,其中86%以上的基因組被組裝,大約80%的序列被配置設定到染色體上。總共預測了 34,183 個蛋白質編碼基因。基因組重複分析顯示,與大豆不同,紅豆基因組缺乏最近的全基因組重複事件。與其他已測序的豆科植物基因組相比,紅豆基因組與普通豆的同線性度高于大豆、木豆、紫花苜蓿、鷹嘴豆和蓮花。更有趣的是,發現與大豆相比,紅豆種子的低脂肪和高澱粉含量不是由基因拷貝數變異引起的,而是由基因表達量引起的。此外,還通過種群分析發現半野生紅豆是一種初步的地方品種,其中有11個野生、11個半野生種質、17個地方品種和11個改良品種,并在馴化中檢測到強烈的選擇信号。