天天看點

火龍果基因組進化與甜菜素合成途徑

作者:生物多樣性與系統發育
火龍果基因組進化與甜菜素合成途徑

文章資訊

火龍果基因組進化與甜菜素合成途徑
火龍果基因組進化與甜菜素合成途徑

摘要

由于缺乏參考基因組,黃色火龍果(Selenicereus megalanthus,2n=4x=44)的育種仍然受到嚴重阻礙。在這裡,我們基于Hi-C、ATAC和特定組織的RNA-seq資料,論述了黃色火龍果的高品質染色體水準基因組組裝,并将表型性狀與基因組資料聯系起來。我們宣布黃色火龍果為同源四倍體,基因組大小為7.16Gb(包含27,246個高置信度基因),主要由二倍體祖先進化而來,但其祖先目前尚不清楚。除了生成基因組組裝之外,我們還探索了3D染色質組織,揭示了對基因組、區室A(648和519)、區室B(728和1064)、拓撲相關域TAD(3376和2031)以及二倍體和多倍體火龍果中分别存在不同數量的結構變異(SV)。總體而言,兩種火龍果物種中的AP2、WRKY18/60/75、MYB63/116、PHL2和GATA8基序豐富了TAD邊界。通過将開放的染色質基因組結構與功能聯系起來,我們确定了二倍體和多倍體火龍果中甜菜素生物合成途徑的主要變化。此外,SmeADH1[Chr11,區室A(135400000-135500000)、TAD區域内的基因(135480000-135520000)]的基因表達較高,而HuDOPA[Chr11,區室A(87100000-87200000)]的表達較低,TAD區域内的基因(87160000-87200000)]分别作為多倍體和二倍體火龍果果皮上黃色和紅色的關鍵調節因子。此外,二倍體火龍果中HuCYP76AD1基因的較高表達和多倍體火龍果中SmeCYP76AD1的較低表達可能造成氧化酶過程的差異,進而分别導緻甜菜紅素和甜菜黃素的産生。此外,我們的結果不僅揭示了在性狀模式中發揮潛在作用的基序類型,而且我們還進一步發現,TAD邊界中的基序計數可能會影響二倍體和多倍體火龍果TAD區域内的基因表達。3D常染色質結構的二倍體和多倍體火龍果物種的比較不僅有助于推進分子育種工作基因組組織、SV、區室化(A和B)。

結果

關鍵創新點

盡管基因組學工具取得了巨大進步以及對火龍果的需求不斷增長,同源四倍體黃色火龍果(S.megalanthus,2n=4x=44)的高品質參考基因組仍然缺乏,阻礙了其分子育種。是以,我們努力采用現代基因組學工具,深入了解黃火龍果的基因組。創新重點是:

1.我們使用PacBio-HiFi進行長讀長測序并論述了同源四倍體(S.megalanthus;2n=4x=44;~7.16Gb)的高品質染色體水準基因組序列群組裝。

2.我們解決了百年來對黃色火龍果分類和進化的誤解,并宣布其為高雜合性同源四倍體(AAAB)。

3.我們同時采用Hi-C和RNA-seq,發現了與紅色和黃色火龍果基因組中不同表型性狀相關的推定基因。整合方法比單獨的RNA-seq更有價值,因為它将空間基因組組織與基因表達相結合,提供了對基因調控和互相作用的見解,快速跟蹤目标基因的發現,并減少了育種計劃所需的時間和精力。此前,這種內建方法僅由Liu等人使用。(DOI:10.1126/science.adg3797)。

4.通過利用二倍體和同源四倍體火龍果的比較基因組學,我們确定了兩個基因組中的染色體組織、染色質結構、基因組區室化(A和B)拓撲相關域(TAD)邊界和結構變異(SV)。

詳細總結

火龍果(Dragon fruit)或火龍果(pitaya)屬于仙人掌科(石龍目),這是一個古老的科,起源于~6500萬年前。蛇鞭柱屬分為28種;其中,S.megalanthus(2n=4x=44)和S.undatus(2n=22)(原Hylocereus undatus)是最具商業化和消費價值的植物群,其果實外觀、顔色、風味誘人,富含維生素、抗氧化劑、礦物質、植物化學物質、膳食纖維和預防癌症。盡管基因組學工具取得了巨大的進步,人們對火龍果的需求日益增長,但同源四倍體黃火龍果(S.megalanthus,2n=4x=44)的高品質參考基因組仍然缺乏,阻礙了其分子育種。此外,迫切需要繪制二倍體紅火龍果(紅果皮、細莖/枝和綠色鳍狀的部分)與四倍體黃火龍果(黃果皮、粗莖/枝和刺)之間的表型變異圖譜,以加快分子育種計劃。是以,我們報道了黃火龍果高品質的染色體水準基因組組裝,并基于組織特異性的Hi-C、ATAC和RNA-seq資料,将表型性狀與基因組資料聯系起來。我們宣布黃色火龍果為具有高雜合性(AAAB)的同源四倍體,估計基因組為7.16Gb,包含27246個基因,主要從二倍體祖先進化而來,這仍然是未知的。

除了基因組組裝外,我們還比較和探索了二倍體紅火龍果(2n=22)和同源四倍體黃火龍果(2n=4x=44)基因組之間的3D染色質組織,并鑒定了染色體組織、染色質結構、基因組區隔(A和B)、拓撲相關結構域(TADs)邊界、以及兩種基因組中的結構變異(SVs)。總體而言,兩種火龍果的TAD邊界都豐富了AP2、WRKY18/60/75、MYB63/116、PHL2和GATA8的基序。此外,通過将開放的染色質基因組結構與功能聯系起來,我們确定了兩種火龍果中調節“甜菜素生物合成”的莽草酸通路的主要變化。基于rna-seq的表達分析發現,TAD區(115360,000-115400000)内SmeDOPA基因的高表達[Chr08,A室(115300000-115500000)]和TAD區(97520000-97560000)内HuDOPA基因的低表達[Chr08,A室(97500000-97600000)] 作為多倍體和二倍體火龍果果皮黃色和紅色的關鍵調節劑。此外,我們的研究結果不僅發現了基序類型在性狀模式中發揮潛在作用,而且進一步揭示了TAD邊界的基序計數可能影響二倍體和多倍體火龍果TAD區域内的基因表達。簡而言之,我們對二倍體和多倍體火龍果物種的基因組資源比較不僅有助于全球分子育種(例如GAB)的發展,而且還有助于了解基因組的組織、SVs、區化(A和B)和TADs。這有可能加強未來基于TADs的性狀改進。

圖表

表1:黃火龍果(Selenicereusmegalanthus)基因組組裝總結

火龍果基因組進化與甜菜素合成途徑

表2:隔室數量及長度分布統計表

火龍果基因組進化與甜菜素合成途徑
火龍果基因組進化與甜菜素合成途徑
火龍果基因組進化與甜菜素合成途徑

圖1:被誤解的多倍體S.megalanthus的分類、進化。二倍體和多倍體火龍果的比較基因組學和表型組學。a)黃色和b)紅色火龍果(白色果肉)的表型特征。c)100年來被誤解的黃色火龍果分類示意圖。我們組裝的基因組資源提供了對黃色火龍果進化的見解(97%的同源四倍體,3%的異源多倍體)。d)它顯示了新組裝的黃色火龍果基因組的染色體間合性。e)二倍體和四倍體火龍果的比較基因組學。3D基因組、TAD邊界和RNA-seq資料的綜合分析揭示了與兩種物種各自表型性狀(果色)相關的特定基因。這種方法可以跳過費力的MAS育種方法。

火龍果基因組進化與甜菜素合成途徑

圖2:同源四倍體黃色火龍果基因組(S.megalanthus)的基因組特征。環表示11條染色體,a)表示GC含量分布,b)基因密度分布,c)總重複密度分布,d)長末端重複(LTR)分布,e)LINE密度分布,f)dna-轉座元件分布。

火龍果基因組進化與甜菜素合成途徑

圖3:同源四倍體染色體上的Contig分布圖,S.megalanthus的分化時間,基因家族擴張和收縮的估計。a)灰色表示每條染色體的長度,其他顔色表示不同長度範圍的contig。b)黃色火龍果與其他植物物種的分化時間。節點位置的數字代表植物物種與其祖先在百萬年前(MYA)的分化時間。括号中也提到了95%最高後驗密度(HPD)支援的分化時間。系統發育樹的分支長度僅表示每個點的堿基替換次數或遺傳距離。c)植物物種中基因家族的擴充和收縮。綠色表示在物種進化過程中加入到基因組中的基因家族,紅色表示該植物物種中基因家族的丢失。

火龍果基因組進化與甜菜素合成途徑

圖4:二倍體和多倍體火龍果的3D基因組結構分析。a)單染色體室。b) S.megalanthus的單染色體室。[圖4a和4b的上半部分表示室A/B值的分布。藍色條表示基因組的活性(A)部分,而紅色條表示基因組的非活性(B)部分。圖的下半部分表示由單個染色體互相作用矩陣轉換而來的相關矩陣。顔色條表示相關系數]。c) S. undatus的單染色體TADs。橫軸表示參考基因組上的位置(機關:Mb)。圖的上半部分表示單個染色體在特定位置的互相作用。圖中下半部分,藍線為保溫評分,灰線為TAD邊界。d)二倍體火龍果TAD邊界内的基因數。e)多倍體火龍果TAD邊界内的基因數。[圖4d和4e中的橫軸表示TAD内(Inter)和TAD邊界(Border)的基因數量。]****中的顯著性檢驗結果代表0.0001≥p]。f)多倍體火龍果TAD邊界内的基因數。橫軸表示TAD内(Inter)和TAD邊界(Border)的基因數量。****中的顯著性檢驗結果代表0.0001≥p。g) S.megalanthus的單染色體TADs。橫軸表示參考基因組上的位置(機關:Mb)。圖的上半部分表示單個染色體在特定位置的互相作用。圖中下半部分,藍線為保溫評分,灰線為TAD邊界。h)二倍體火龍果全基因組順式/跨式顯著互相作用位點圓形圖。i)多倍體火龍果全基因組順式/跨式顯著互相作用位點的圓形圖。在圖4h和4i中,染色體的名稱和數目在圖中順時針方向呈現。紅色表示每條染色體上的基因數量。從深藍色到淺藍色的線條表示每條染色體上的p值從大到小和順式顯著的互相作用位點。紅色條表示與其他染色體顯著的反式互相作用位點。藍色從深到淺表示支援從大到小互相作用的reads的數量。j) S. undatus前5基序序列。k) S.megalanthus前5基序序列。在圖4j和4k中,橫軸表示motif的長度(機關:bp),縱軸表示ATGC堿基的頻率分布。

火龍果基因組進化與甜菜素合成途徑

圖5:二倍體和多倍體火龍果種的全基因組比較分析。a)200kb分辨率的互作熱圖顯示了多倍體和二倍體火龍果基因組的差異(S.megalanthus的差異減去S.undatus的互作差異)。包括紅色在内的色條表明,S.megalanthus的互相作用強度大于S.undatus。藍色表示相反的效果,較高的值表明該位點在二倍體和多倍體基因組上的互相作用強度存在差異。橫軸和縱軸表示基因組的位置。b)兩種火龍果種在200-kb分辨率下單染色體互相作用的簡化熱圖。紅色條形圖表示大花荊芥的互相作用強度大于花荊芥。藍色條的值越大,表示兩種互相作用強度的差異越大。c)對比圖和隔室鞍圖。圖上的紅色對比圖為隔室A,藍條代表隔室b。在鞍形圖中,顔色表示二倍體和多倍體火龍果隔室AA、BB和AB的互相作用信号。d)二倍體和多倍體火龍果差異室間基因密度分布。橫軸表示四種不同類型的區室,縱軸表示區域内基因密度分布。e)二倍體(S.undatus)和多倍體(S.megalanthus)火龍果共同和獨特TAD邊界的維恩圖。f)兩個物種之間的共同和獨特的順式顯著互相作用的維恩圖。g)跨顯著性互相作用的維恩圖,包括兩種物種之間的共同和獨特互相作用h)二倍體和多倍體物種差異區室中的GO注釋基因。橫軸表示注釋到GO項的基因數量。縱軸表示三大類GO術語,包括生物過程、細胞成分和分子功能。i)基因表達在基因組區室之間的分布。橫軸上分為S.undatus和S.megalanthus。縱軸表示基因在A2A、A2B、B2A和B2B隔室中的表達分布。注:顯著性檢驗結果****代表0.0001≥p。但“ns”表示不顯著結果。j)二倍體和多倍體火龍果(S.undatus-S.megalanthus)差異室基因密度分布及室間基因切換。橫軸表示四個隔室開關,橫軸表示保守隔室(A2A和B2B)和開關隔室(A2B和B2A)的基因數量分布。

火龍果基因組進化與甜菜素合成途徑

圖6:同源四倍體多倍體火龍果的基因組結構變異。藍色條表示黃色火龍果的參考基因組,而橙色條表示紅皮火龍果的二倍體基因組。藍色條(參考序列)表示S.undatus的基因組。橙色條(查詢序列)代表黃色火龍果(S.megalanthus)的基因組。

火龍果基因組進化與甜菜素合成途徑

圖7:二倍體和多倍體火龍果全基因組ATAC-seq分析。a) S.undatus和S.megalanthus基因組TSS區ATAC-seq信号富集圖。熱圖的橫軸為TSS上遊和下遊3kb,縱軸為基因。趨勢圖的橫軸為TSS上下遊3KB範圍,縱軸為基因組位置的信号富集。b)二倍體和多倍體火龍果的DAR聚類圖。橫軸為火龍果種類的名稱,縱軸為兩種火龍果比較得到的DAR。圖中的顔色表示了每個物種的DAR信号值的大小。c)DAR和DAR的分布。該地圖顯示了DAR在基因組上的位置以及DAR在該位置上的比例。d)位于啟動子區域的獲得DAR和丢失DAR相關基因中的GO項。基因根據其術語聚類,并顯示其功能在左邊。e) DAR相關基因與差異表達基因的比較,以鑒定啟動子區域的重疊基因。f) DAR相關基因表達的箱形圖。g)多組學資料可視化顯示二倍體和多倍體火龍果物種間染色質可及性存在顯著差異。

火龍果基因組進化與甜菜素合成途徑

圖8:将組織特異性基因表達連接配接到二倍體和多倍體火龍果的開放染色質。a)二倍體火龍果與甜菜素合成相關的基因除少數基因外,在相同染色體數下與黃色火龍果基因組序列相似性較高,拷貝數也存在差異。基因可能在紅皮火龍果(S.undatus)中發揮潛在作用,參與調節途徑并産生與環多巴亞氨基自發結合的酶,最終形成甜菜素色素,即紅紫色甜菜青素。在同源四倍體火龍果中,屬于SmeABA2、SmeFG2/3和SmeHD-ZIP家族的基因發揮着與氨基自發凝聚甜菜醛氨酸以産生黃色甜菜素的潛在作用,而不是b)黃色火龍果中直接調控莽草酸通路的基因(Sme_10G0002470,Sme_7G0004800)的表達量比果皮紅皮火龍果中表達的基因(HU10G00264,HU07G00551)高3倍。CYP736A12基因的同源拷貝位于黃色火龍果基因組的A室和B室。在黃色火龍果的進化和多倍體化過程中,與紅皮火龍果相比,黃色火龍果A/B室中CYP736A12基因拷貝的重複和CYP36A12基因表達的減少最終導緻黃色火龍果失去将酪氨酸氧化酶轉化為L-DOPA的能力,轉而産生甜菜黃素。c)多倍體火龍果TAD邊界40-Kb區域鑒定的TFs和前5位TFs。d)二倍體火龍果TAD邊界40-Kb區域鑒定的TFs和前5位TFs如圖所示。

Dr.Qamar近年來所發表的論文

1. Zaman QU, L Hui, MF Nazir, G Wang, V Garg, M Ikram, A Raza, W Lv, D Khan, AA Khokhar, Z You, A Chitikineni, B Usman, C Jianpeng, X Yang, S Zuo, P Liu, S Kumar, M Guo, ZX Zhu, G Dwivedi, YH Qin, RK Varshney*, HF Wang*. Chromosome-level genome assembly of autotetraploid Selenicereus megalanthus and gaining genomic insights into the evolution of trait patterning in diploid and polyploid pitaya species. Submitted to Preprint: https://doi.org/10.1101/2024.06.23.600268. [Top期刊,IF:10.1,按照發表時的分區和影響因子,下同].

2. Zaman QU, A Raza, L Chao, JL Juste, MGK Jones, HF Wang*, R K Varshney. Engineering plants using diverse CRISPR-associated proteins and deregulation of genome-edited crops. Trends in Biotechnology, 42(5): 560-574. https://doi.org/10.1016/j.tibtech.2023.10.007 [中科院一區Top期刊,IF:17.3].

3. Zaman QU, A Raza, RA Gill, MA Hussain, HF Wang*, RK Varshney. 2023. New possibilities for trait improvement via mobile CRISPR-RNA. Trends in Biotechnology, 41(11), 1335-1338. (https://doi.org/10.1016/j.tibtech.2023.05.001).[中科院一區Top期刊,IF: 21.942].

4. Zaman QU, V Garg, A Raza, MF Nazir, L Hui, D Khan, AA Khokhar, MA Hussain, H-F Wang*, R K Varshney. Unique regulatory network of dragon fruit mitigates the effect of vanadium pollutant and environmental factors simultaneously. Physiologia Plantarum, e14416. https://doi.org/10.1111/ ppl.14416 [中科院二區,IF:5.4].

5. Zaman QU, MA Hussain, LU Khan, L Hui, D Khan, AA Khokhar, JP Cui, A Raza, HF Wang*. 2023. Genome-wide identification and expression profiling of APX gene family under multifactorial stress combinations and melatonin-mediated tolerance in pitaya. Scientia Horticulturae 321, 112312. [中科院二區Top期刊,IF: 4.3].

6. Zaman QU, MA Hussain, LU Khan, JP Cui, L Hui, D Khan, W Lv, HF Wang*. 2023. Genome-wide identification and expression pattern of GRAS gene family in pitaya (Selenicereus undatus L.). Biology 2023, 12(1),11[中科院一區,IF: 5.168].

7. Zaman QU, LU Khan, MA Hussain, A Ali, L Hui, AA Khokhar, D Khan, HF Wang*. Characterizing the HMA gene family in dragon fruit (Selenicereus undatus L.) and revealing their response to multifactorial stress combinations and melatonin-mediated tolerance. South African Journal of Botany, 163, 145-156. [I.F:3.1].

8. Zaman QU, W Chu, M Hao, Y Shi, D Mei, J Batley, B Zhang, C Li, Q Hu. 2021. Characterization of SHATTERPROOF homoeologs and CRISPR-Cas9-mediated genome editing enhances pod-shattering resistance in Brassica napus L. CRISPR Journal 4(3):360-370. [I.F:4.321]

9. Zaman QU, W Chu, M Hao, Y Shi, M Sun, S Sang, D Mei, H Cheng, J Liu, C Li, Q Hu. 2019. CRISPR/Cas9-mediated multiplex genome editing of JAGGED gene in Brassica napus L. Biomolecules 9,725. [I.F: 6.064].

10. Wang H*, QU Zaman*, W Huang, D Mei, J Liu, W Wang, B Ding, M Hao, L Fu, H Cheng, Q Hu. 2019. QTL and candidate genes identification for silique length based on high-dense genetic map in Brassica napus L. Frontiers in Plant Sciences 10,1579. [IF: 6.627].

11. Zaman QU, C Li, C Hongtao, H Qiong. 2019. Genome editing opens a new era of genetic improvement in polyploid crops. Crop Journal 7(2):141-150. [IF: 6.6].

12.Khokhar AA, L Hui, D Khan, W Lv, MA Hussain, QU Zaman, HF Wang. Comprehensive characterization of SBP genes revealed their role under multifactorial stress combinations dragon fruit (Selenicereus undatus L.). Plant Stress, 10, 100294. https://doi.org/10.1016/j.stress.2023.100294 [IF: 6].

13.. Darya Khan, L Hui, AA Khokhar, MA Hussain, W Lv, QU Zaman, HF Wang*. 2024. Functional characterization of MATE gene family under abiotic stresses and melatonin-mediated tolerance in pitaya (Selenicereus undatus L.). Plant Stress, 11, 100300. [IF: 6]. https://doi.org/10.1016/j.stress.2023.100300

14. Sang S, Y Wang, G Yao, T Ma, X Sun, Y Zhang, N Su, X Tan, HMK Abbas, S Ji, QU Zaman. A Critical Review of Conventional and Modern Approaches to Develop Herbicide-Resistance in Rice. Physiologia Plantarum, 176(2), e14254. https://doi.org/10.1111/ppl.14254. [IF: 6.4].

15. Hui L, D Khan, AA Khokhar, B Usman, QU Zaman, HF Wang*. Genome-wide identification and expression pattern of the MADS BOX gene family in pitaya (Selenicereus undatus L.). Plant Stress, 12, 100492. https://doi.org/10.1016/j.stress.2024.100492. [IF: 6].

16. Alam O, LU Khan, A Khan, F Mehwish, MA Husain, WU Khan, QU Zaman, HF Wang. Genome-wide identification and expression analysis of the Dof gene family in dragon fruit (Selenicereus undatus) under multiple abiotic stresses. Functional Plant Biology, 51, FP23269. doi.org/10.1071/FP23269.[IF: 3].

成員風采

火龍果基因組進化與甜菜素合成途徑

生物多樣性與系統發育基因組學團隊合照

火龍果基因組進化與甜菜素合成途徑

王華鋒教授(左一)Rajeev K.Varshney-FRS教授

火龍果基因組進化與甜菜素合成途徑
火龍果基因組進化與甜菜素合成途徑

王華鋒教授與QAMAR博士火龍果基地調研圖

王華鋒教授的實驗室(海南大學)與Rajeev K. Varshney教授(澳洲默多克大學)有着良好的合作關系。Rajeev K.Varshney教授開放他們的實驗室資源,以支援我們的Pitaya基因組測序項目。

火龍果基因組進化與甜菜素合成途徑
火龍果基因組進化與甜菜素合成途徑

Rajeev K. Varshney-FRS教授

火龍果基因組進化與甜菜素合成途徑

QAMAR博士

文章标題:Chromosome-level genome assembly of autotetraploid Selenicereus megalanthus and gaining genomic insights into the evolution of trait patterning in diploid and polyploid pitaya species

作者資訊:Qamar U Zaman, Liu Hui, Mian Faisal Nazir, Guoqing Wang, Vanika Garg, Muhammad Ikram, Ali Raza,Wei Lv, Darya Khan, Aamir Ali Khokhar, Zhang You, Annapurna Chitikineni, Babar Usman, Cui Jianpeng, Xulong Yang, Shiyou Zuo, Peifeng Liu, Sunjeet Kumar, Mengqi Guo, Zhi-Xin Zhu, Girish Dwivedi, Yong-Hua Qin, Rajeev K. Varshney, Hua-Feng Wang

原文連結:https://www.biorxiv.org/content/10.1101/2024.06.23.600268v1

文内圖檔及封面圖檔來源原文

火龍果基因組進化與甜菜素合成途徑

繼續閱讀