天天看点

火龙果基因组进化与甜菜素合成途径

作者:生物多样性与系统发育
火龙果基因组进化与甜菜素合成途径

文章信息

火龙果基因组进化与甜菜素合成途径
火龙果基因组进化与甜菜素合成途径

摘要

由于缺乏参考基因组,黄色火龙果(Selenicereus megalanthus,2n=4x=44)的育种仍然受到严重阻碍。在这里,我们基于Hi-C、ATAC和特定组织的RNA-seq数据,论述了黄色火龙果的高质量染色体水平基因组组装,并将表型性状与基因组数据联系起来。我们宣布黄色火龙果为同源四倍体,基因组大小为7.16Gb(包含27,246个高置信度基因),主要由二倍体祖先进化而来,但其祖先目前尚不清楚。除了生成基因组组装之外,我们还探索了3D染色质组织,揭示了对基因组、区室A(648和519)、区室B(728和1064)、拓扑相关域TAD(3376和2031)以及二倍体和多倍体火龙果中分别存在不同数量的结构变异(SV)。总体而言,两种火龙果物种中的AP2、WRKY18/60/75、MYB63/116、PHL2和GATA8基序丰富了TAD边界。通过将开放的染色质基因组结构与功能联系起来,我们确定了二倍体和多倍体火龙果中甜菜素生物合成途径的主要变化。此外,SmeADH1[Chr11,区室A(135400000-135500000)、TAD区域内的基因(135480000-135520000)]的基因表达较高,而HuDOPA[Chr11,区室A(87100000-87200000)]的表达较低,TAD区域内的基因(87160000-87200000)]分别作为多倍体和二倍体火龙果果皮上黄色和红色的关键调节因子。此外,二倍体火龙果中HuCYP76AD1基因的较高表达和多倍体火龙果中SmeCYP76AD1的较低表达可能造成氧化酶过程的差异,从而分别导致甜菜红素和甜菜黄素的产生。此外,我们的结果不仅揭示了在性状模式中发挥潜在作用的基序类型,而且我们还进一步发现,TAD边界中的基序计数可能会影响二倍体和多倍体火龙果TAD区域内的基因表达。3D常染色质结构的二倍体和多倍体火龙果物种的比较不仅有助于推进分子育种工作基因组组织、SV、区室化(A和B)。

结果

关键创新点

尽管基因组学工具取得了巨大进步以及对火龙果的需求不断增长,同源四倍体黄色火龙果(S.megalanthus,2n=4x=44)的高质量参考基因组仍然缺乏,阻碍了其分子育种。因此,我们努力采用现代基因组学工具,深入了解黄火龙果的基因组。创新重点是:

1.我们使用PacBio-HiFi进行长读长测序并论述了同源四倍体(S.megalanthus;2n=4x=44;~7.16Gb)的高质量染色体水平基因组序列和组装。

2.我们解决了百年来对黄色火龙果分类和进化的误解,并宣布其为高杂合性同源四倍体(AAAB)。

3.我们同时采用Hi-C和RNA-seq,发现了与红色和黄色火龙果基因组中不同表型性状相关的推定基因。整合方法比单独的RNA-seq更有价值,因为它将空间基因组组织与基因表达相结合,提供了对基因调控和相互作用的见解,快速跟踪目标基因的发现,并减少了育种计划所需的时间和精力。此前,这种集成方法仅由Liu等人使用。(DOI:10.1126/science.adg3797)。

4.通过利用二倍体和同源四倍体火龙果的比较基因组学,我们确定了两个基因组中的染色体组织、染色质结构、基因组区室化(A和B)拓扑相关域(TAD)边界和结构变异(SV)。

详细总结

火龙果(Dragon fruit)或火龙果(pitaya)属于仙人掌科(石龙目),这是一个古老的科,起源于~6500万年前。蛇鞭柱属分为28种;其中,S.megalanthus(2n=4x=44)和S.undatus(2n=22)(原Hylocereus undatus)是最具商业化和消费价值的植物群,其果实外观、颜色、风味诱人,富含维生素、抗氧化剂、矿物质、植物化学物质、膳食纤维和预防癌症。尽管基因组学工具取得了巨大的进步,人们对火龙果的需求日益增长,但同源四倍体黄火龙果(S.megalanthus,2n=4x=44)的高质量参考基因组仍然缺乏,阻碍了其分子育种。此外,迫切需要绘制二倍体红火龙果(红果皮、细茎/枝和绿色鳍状的部分)与四倍体黄火龙果(黄果皮、粗茎/枝和刺)之间的表型变异图谱,以加快分子育种计划。因此,我们报道了黄火龙果高质量的染色体水平基因组组装,并基于组织特异性的Hi-C、ATAC和RNA-seq数据,将表型性状与基因组数据联系起来。我们宣布黄色火龙果为具有高杂合性(AAAB)的同源四倍体,估计基因组为7.16Gb,包含27246个基因,主要从二倍体祖先进化而来,这仍然是未知的。

除了基因组组装外,我们还比较和探索了二倍体红火龙果(2n=22)和同源四倍体黄火龙果(2n=4x=44)基因组之间的3D染色质组织,并鉴定了染色体组织、染色质结构、基因组区隔(A和B)、拓扑相关结构域(TADs)边界、以及两种基因组中的结构变异(SVs)。总体而言,两种火龙果的TAD边界都丰富了AP2、WRKY18/60/75、MYB63/116、PHL2和GATA8的基序。此外,通过将开放的染色质基因组结构与功能联系起来,我们确定了两种火龙果中调节“甜菜素生物合成”的莽草酸通路的主要变化。基于rna-seq的表达分析发现,TAD区(115360,000-115400000)内SmeDOPA基因的高表达[Chr08,A室(115300000-115500000)]和TAD区(97520000-97560000)内HuDOPA基因的低表达[Chr08,A室(97500000-97600000)] 作为多倍体和二倍体火龙果果皮黄色和红色的关键调节剂。此外,我们的研究结果不仅发现了基序类型在性状模式中发挥潜在作用,而且进一步揭示了TAD边界的基序计数可能影响二倍体和多倍体火龙果TAD区域内的基因表达。简而言之,我们对二倍体和多倍体火龙果物种的基因组资源比较不仅有助于全球分子育种(例如GAB)的发展,而且还有助于了解基因组的组织、SVs、区化(A和B)和TADs。这有可能加强未来基于TADs的性状改进。

图表

表1:黄火龙果(Selenicereusmegalanthus)基因组组装总结

火龙果基因组进化与甜菜素合成途径

表2:隔室数量及长度分布统计表

火龙果基因组进化与甜菜素合成途径
火龙果基因组进化与甜菜素合成途径
火龙果基因组进化与甜菜素合成途径

图1:被误解的多倍体S.megalanthus的分类、进化。二倍体和多倍体火龙果的比较基因组学和表型组学。a)黄色和b)红色火龙果(白色果肉)的表型特征。c)100年来被误解的黄色火龙果分类示意图。我们组装的基因组资源提供了对黄色火龙果进化的见解(97%的同源四倍体,3%的异源多倍体)。d)它显示了新组装的黄色火龙果基因组的染色体间合性。e)二倍体和四倍体火龙果的比较基因组学。3D基因组、TAD边界和RNA-seq数据的综合分析揭示了与两种物种各自表型性状(果色)相关的特定基因。这种方法可以跳过费力的MAS育种方法。

火龙果基因组进化与甜菜素合成途径

图2:同源四倍体黄色火龙果基因组(S.megalanthus)的基因组特征。环表示11条染色体,a)表示GC含量分布,b)基因密度分布,c)总重复密度分布,d)长末端重复(LTR)分布,e)LINE密度分布,f)dna-转座元件分布。

火龙果基因组进化与甜菜素合成途径

图3:同源四倍体染色体上的Contig分布图,S.megalanthus的分化时间,基因家族扩张和收缩的估计。a)灰色表示每条染色体的长度,其他颜色表示不同长度范围的contig。b)黄色火龙果与其他植物物种的分化时间。节点位置的数字代表植物物种与其祖先在百万年前(MYA)的分化时间。括号中也提到了95%最高后验密度(HPD)支持的分化时间。系统发育树的分支长度仅表示每个点的碱基替换次数或遗传距离。c)植物物种中基因家族的扩展和收缩。绿色表示在物种进化过程中加入到基因组中的基因家族,红色表示该植物物种中基因家族的丢失。

火龙果基因组进化与甜菜素合成途径

图4:二倍体和多倍体火龙果的3D基因组结构分析。a)单染色体室。b) S.megalanthus的单染色体室。[图4a和4b的上半部分表示室A/B值的分布。蓝色条表示基因组的活性(A)部分,而红色条表示基因组的非活性(B)部分。图的下半部分表示由单个染色体相互作用矩阵转换而来的相关矩阵。颜色条表示相关系数]。c) S. undatus的单染色体TADs。横轴表示参考基因组上的位置(单位:Mb)。图的上半部分表示单个染色体在特定位置的相互作用。图中下半部分,蓝线为保温评分,灰线为TAD边界。d)二倍体火龙果TAD边界内的基因数。e)多倍体火龙果TAD边界内的基因数。[图4d和4e中的横轴表示TAD内(Inter)和TAD边界(Border)的基因数量。]****中的显著性检验结果代表0.0001≥p]。f)多倍体火龙果TAD边界内的基因数。横轴表示TAD内(Inter)和TAD边界(Border)的基因数量。****中的显著性检验结果代表0.0001≥p。g) S.megalanthus的单染色体TADs。横轴表示参考基因组上的位置(单位:Mb)。图的上半部分表示单个染色体在特定位置的相互作用。图中下半部分,蓝线为保温评分,灰线为TAD边界。h)二倍体火龙果全基因组顺式/跨式显著相互作用位点圆形图。i)多倍体火龙果全基因组顺式/跨式显著相互作用位点的圆形图。在图4h和4i中,染色体的名称和数目在图中顺时针方向呈现。红色表示每条染色体上的基因数量。从深蓝色到浅蓝色的线条表示每条染色体上的p值从大到小和顺式显著的相互作用位点。红色条表示与其他染色体显著的反式相互作用位点。蓝色从深到浅表示支持从大到小相互作用的reads的数量。j) S. undatus前5基序序列。k) S.megalanthus前5基序序列。在图4j和4k中,横轴表示motif的长度(单位:bp),纵轴表示ATGC碱基的频率分布。

火龙果基因组进化与甜菜素合成途径

图5:二倍体和多倍体火龙果种的全基因组比较分析。a)200kb分辨率的互作热图显示了多倍体和二倍体火龙果基因组的差异(S.megalanthus的差异减去S.undatus的互作差异)。包括红色在内的色条表明,S.megalanthus的相互作用强度大于S.undatus。蓝色表示相反的效果,较高的值表明该位点在二倍体和多倍体基因组上的相互作用强度存在差异。横轴和纵轴表示基因组的位置。b)两种火龙果种在200-kb分辨率下单染色体相互作用的简化热图。红色条形图表示大花荆芥的相互作用强度大于花荆芥。蓝色条的值越大,表示两种相互作用强度的差异越大。c)对比图和隔室鞍图。图上的红色对比图为隔室A,蓝条代表隔室b。在鞍形图中,颜色表示二倍体和多倍体火龙果隔室AA、BB和AB的相互作用信号。d)二倍体和多倍体火龙果差异室间基因密度分布。横轴表示四种不同类型的区室,纵轴表示区域内基因密度分布。e)二倍体(S.undatus)和多倍体(S.megalanthus)火龙果共同和独特TAD边界的维恩图。f)两个物种之间的共同和独特的顺式显著相互作用的维恩图。g)跨显著性相互作用的维恩图,包括两种物种之间的共同和独特相互作用h)二倍体和多倍体物种差异区室中的GO注释基因。横轴表示注释到GO项的基因数量。纵轴表示三大类GO术语,包括生物过程、细胞成分和分子功能。i)基因表达在基因组区室之间的分布。横轴上分为S.undatus和S.megalanthus。纵轴表示基因在A2A、A2B、B2A和B2B隔室中的表达分布。注:显著性检验结果****代表0.0001≥p。但“ns”表示不显著结果。j)二倍体和多倍体火龙果(S.undatus-S.megalanthus)差异室基因密度分布及室间基因切换。横轴表示四个隔室开关,横轴表示保守隔室(A2A和B2B)和开关隔室(A2B和B2A)的基因数量分布。

火龙果基因组进化与甜菜素合成途径

图6:同源四倍体多倍体火龙果的基因组结构变异。蓝色条表示黄色火龙果的参考基因组,而橙色条表示红皮火龙果的二倍体基因组。蓝色条(参考序列)表示S.undatus的基因组。橙色条(查询序列)代表黄色火龙果(S.megalanthus)的基因组。

火龙果基因组进化与甜菜素合成途径

图7:二倍体和多倍体火龙果全基因组ATAC-seq分析。a) S.undatus和S.megalanthus基因组TSS区ATAC-seq信号富集图。热图的横轴为TSS上游和下游3kb,纵轴为基因。趋势图的横轴为TSS上下游3KB范围,纵轴为基因组位置的信号富集。b)二倍体和多倍体火龙果的DAR聚类图。横轴为火龙果种类的名称,纵轴为两种火龙果比较得到的DAR。图中的颜色表示了每个物种的DAR信号值的大小。c)DAR和DAR的分布。该地图显示了DAR在基因组上的位置以及DAR在该位置上的比例。d)位于启动子区域的获得DAR和丢失DAR相关基因中的GO项。基因根据其术语聚类,并显示其功能在左边。e) DAR相关基因与差异表达基因的比较,以鉴定启动子区域的重叠基因。f) DAR相关基因表达的箱形图。g)多组学数据可视化显示二倍体和多倍体火龙果物种间染色质可及性存在显著差异。

火龙果基因组进化与甜菜素合成途径

图8:将组织特异性基因表达连接到二倍体和多倍体火龙果的开放染色质。a)二倍体火龙果与甜菜素合成相关的基因除少数基因外,在相同染色体数下与黄色火龙果基因组序列相似性较高,拷贝数也存在差异。基因可能在红皮火龙果(S.undatus)中发挥潜在作用,参与调节途径并产生与环多巴亚氨基自发结合的酶,最终形成甜菜素色素,即红紫色甜菜青素。在同源四倍体火龙果中,属于SmeABA2、SmeFG2/3和SmeHD-ZIP家族的基因发挥着与氨基自发凝聚甜菜醛氨酸以产生黄色甜菜素的潜在作用,而不是b)黄色火龙果中直接调控莽草酸通路的基因(Sme_10G0002470,Sme_7G0004800)的表达量比果皮红皮火龙果中表达的基因(HU10G00264,HU07G00551)高3倍。CYP736A12基因的同源拷贝位于黄色火龙果基因组的A室和B室。在黄色火龙果的进化和多倍体化过程中,与红皮火龙果相比,黄色火龙果A/B室中CYP736A12基因拷贝的重复和CYP36A12基因表达的减少最终导致黄色火龙果失去将酪氨酸氧化酶转化为L-DOPA的能力,转而产生甜菜黄素。c)多倍体火龙果TAD边界40-Kb区域鉴定的TFs和前5位TFs。d)二倍体火龙果TAD边界40-Kb区域鉴定的TFs和前5位TFs如图所示。

Dr.Qamar近年来所发表的论文

1. Zaman QU, L Hui, MF Nazir, G Wang, V Garg, M Ikram, A Raza, W Lv, D Khan, AA Khokhar, Z You, A Chitikineni, B Usman, C Jianpeng, X Yang, S Zuo, P Liu, S Kumar, M Guo, ZX Zhu, G Dwivedi, YH Qin, RK Varshney*, HF Wang*. Chromosome-level genome assembly of autotetraploid Selenicereus megalanthus and gaining genomic insights into the evolution of trait patterning in diploid and polyploid pitaya species. Submitted to Preprint: https://doi.org/10.1101/2024.06.23.600268. [Top期刊,IF:10.1,按照发表时的分区和影响因子,下同].

2. Zaman QU, A Raza, L Chao, JL Juste, MGK Jones, HF Wang*, R K Varshney. Engineering plants using diverse CRISPR-associated proteins and deregulation of genome-edited crops. Trends in Biotechnology, 42(5): 560-574. https://doi.org/10.1016/j.tibtech.2023.10.007 [中科院一区Top期刊,IF:17.3].

3. Zaman QU, A Raza, RA Gill, MA Hussain, HF Wang*, RK Varshney. 2023. New possibilities for trait improvement via mobile CRISPR-RNA. Trends in Biotechnology, 41(11), 1335-1338. (https://doi.org/10.1016/j.tibtech.2023.05.001).[中科院一区Top期刊,IF: 21.942].

4. Zaman QU, V Garg, A Raza, MF Nazir, L Hui, D Khan, AA Khokhar, MA Hussain, H-F Wang*, R K Varshney. Unique regulatory network of dragon fruit mitigates the effect of vanadium pollutant and environmental factors simultaneously. Physiologia Plantarum, e14416. https://doi.org/10.1111/ ppl.14416 [中科院二区,IF:5.4].

5. Zaman QU, MA Hussain, LU Khan, L Hui, D Khan, AA Khokhar, JP Cui, A Raza, HF Wang*. 2023. Genome-wide identification and expression profiling of APX gene family under multifactorial stress combinations and melatonin-mediated tolerance in pitaya. Scientia Horticulturae 321, 112312. [中科院二区Top期刊,IF: 4.3].

6. Zaman QU, MA Hussain, LU Khan, JP Cui, L Hui, D Khan, W Lv, HF Wang*. 2023. Genome-wide identification and expression pattern of GRAS gene family in pitaya (Selenicereus undatus L.). Biology 2023, 12(1),11[中科院一区,IF: 5.168].

7. Zaman QU, LU Khan, MA Hussain, A Ali, L Hui, AA Khokhar, D Khan, HF Wang*. Characterizing the HMA gene family in dragon fruit (Selenicereus undatus L.) and revealing their response to multifactorial stress combinations and melatonin-mediated tolerance. South African Journal of Botany, 163, 145-156. [I.F:3.1].

8. Zaman QU, W Chu, M Hao, Y Shi, D Mei, J Batley, B Zhang, C Li, Q Hu. 2021. Characterization of SHATTERPROOF homoeologs and CRISPR-Cas9-mediated genome editing enhances pod-shattering resistance in Brassica napus L. CRISPR Journal 4(3):360-370. [I.F:4.321]

9. Zaman QU, W Chu, M Hao, Y Shi, M Sun, S Sang, D Mei, H Cheng, J Liu, C Li, Q Hu. 2019. CRISPR/Cas9-mediated multiplex genome editing of JAGGED gene in Brassica napus L. Biomolecules 9,725. [I.F: 6.064].

10. Wang H*, QU Zaman*, W Huang, D Mei, J Liu, W Wang, B Ding, M Hao, L Fu, H Cheng, Q Hu. 2019. QTL and candidate genes identification for silique length based on high-dense genetic map in Brassica napus L. Frontiers in Plant Sciences 10,1579. [IF: 6.627].

11. Zaman QU, C Li, C Hongtao, H Qiong. 2019. Genome editing opens a new era of genetic improvement in polyploid crops. Crop Journal 7(2):141-150. [IF: 6.6].

12.Khokhar AA, L Hui, D Khan, W Lv, MA Hussain, QU Zaman, HF Wang. Comprehensive characterization of SBP genes revealed their role under multifactorial stress combinations dragon fruit (Selenicereus undatus L.). Plant Stress, 10, 100294. https://doi.org/10.1016/j.stress.2023.100294 [IF: 6].

13.. Darya Khan, L Hui, AA Khokhar, MA Hussain, W Lv, QU Zaman, HF Wang*. 2024. Functional characterization of MATE gene family under abiotic stresses and melatonin-mediated tolerance in pitaya (Selenicereus undatus L.). Plant Stress, 11, 100300. [IF: 6]. https://doi.org/10.1016/j.stress.2023.100300

14. Sang S, Y Wang, G Yao, T Ma, X Sun, Y Zhang, N Su, X Tan, HMK Abbas, S Ji, QU Zaman. A Critical Review of Conventional and Modern Approaches to Develop Herbicide-Resistance in Rice. Physiologia Plantarum, 176(2), e14254. https://doi.org/10.1111/ppl.14254. [IF: 6.4].

15. Hui L, D Khan, AA Khokhar, B Usman, QU Zaman, HF Wang*. Genome-wide identification and expression pattern of the MADS BOX gene family in pitaya (Selenicereus undatus L.). Plant Stress, 12, 100492. https://doi.org/10.1016/j.stress.2024.100492. [IF: 6].

16. Alam O, LU Khan, A Khan, F Mehwish, MA Husain, WU Khan, QU Zaman, HF Wang. Genome-wide identification and expression analysis of the Dof gene family in dragon fruit (Selenicereus undatus) under multiple abiotic stresses. Functional Plant Biology, 51, FP23269. doi.org/10.1071/FP23269.[IF: 3].

成员风采

火龙果基因组进化与甜菜素合成途径

生物多样性与系统发育基因组学团队合照

火龙果基因组进化与甜菜素合成途径

王华锋教授(左一)Rajeev K.Varshney-FRS教授

火龙果基因组进化与甜菜素合成途径
火龙果基因组进化与甜菜素合成途径

王华锋教授与QAMAR博士火龙果基地调研图

王华锋教授的实验室(海南大学)与Rajeev K. Varshney教授(澳大利亚默多克大学)有着良好的合作关系。Rajeev K.Varshney教授开放他们的实验室资源,以支持我们的Pitaya基因组测序项目。

火龙果基因组进化与甜菜素合成途径
火龙果基因组进化与甜菜素合成途径

Rajeev K. Varshney-FRS教授

火龙果基因组进化与甜菜素合成途径

QAMAR博士

文章标题:Chromosome-level genome assembly of autotetraploid Selenicereus megalanthus and gaining genomic insights into the evolution of trait patterning in diploid and polyploid pitaya species

作者信息:Qamar U Zaman, Liu Hui, Mian Faisal Nazir, Guoqing Wang, Vanika Garg, Muhammad Ikram, Ali Raza,Wei Lv, Darya Khan, Aamir Ali Khokhar, Zhang You, Annapurna Chitikineni, Babar Usman, Cui Jianpeng, Xulong Yang, Shiyou Zuo, Peifeng Liu, Sunjeet Kumar, Mengqi Guo, Zhi-Xin Zhu, Girish Dwivedi, Yong-Hua Qin, Rajeev K. Varshney, Hua-Feng Wang

原文链接:https://www.biorxiv.org/content/10.1101/2024.06.23.600268v1

文内图片及封面图片来源原文

火龙果基因组进化与甜菜素合成途径

继续阅读