梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
人类基因组测序迎来新的里程碑!
首个完整无间隙人类基因组测序,由近百位科学家合作完成,填补上最后8%的空缺。
最新一期Science罕见地以特刊形式连发6篇论文,另外两篇介绍研究方法的论文同日登上Nature Method。
作者之一、华盛顿大学教授Evan Eichler称:
我们在生命天书中读到了前所未有的新章节。
回看2003年,人类基因组计划(Human Genome Project)首次完成92%的人类基因测序,创造了历史。
到如今,新成立的端粒到端粒联盟(T2T Consortium)填补上最后8%的空缺,同时纠正了之前的一些错误,也将载入史册。
△T2T联盟部分成员
新确认的8%DNA片段里包含重要的免疫反应基因,它们帮助人类适应和抵御病毒和细菌感染,在预测药物反应方面很有价值。
联盟发起人之一、马里兰大学的Adam Phillippy认为,个人基因组测序在10年内有望普及,个性化医疗成本会大幅下降。
另外新发现的基因中有一些使得人类大脑比其他灵长类动物大脑更大,有助于进一步揭开人类进化之谜。
攻克最后的8%
当初的人类基因组计划由6国近2000位科学家耗时13年完成,最后遗留的8%靠当时的测序技术难以突破。
原因有二:
其一,最后的8%里有很多片段是重复的。
科学家们用拼图来形容这一困难。如果拼图里好多小块很相似就更难找到正确的位置。
近几年发展出的新测序方法Oxford Nanopore和PacBio HiFi可以一次处理更长的DNA片段,就好像拼图的块变大,块数变小了。
其二,很难找到只有一套DNA的人类细胞。
正常细胞同时拥有两套DNA,分别来自父亲和母亲,测序时两组DNA混在一起增加了难度。
这次的解决办法是使用一组来自“葡萄胎”的细胞,这是一种罕见妊娠疾病,使胚胎细胞异常生长,只保留一套DNA。
用上新方法,人类DNA序列中30.55亿个碱基对的测序工作终于宣告完工。
人类基因组计划前负责人Robert Waterston对新方法评价到:
(人类基因组)不再有任何隐藏的或未知的部分。
全新的人类参考基因组被命名为T2T-CHM13,今后的个性化基因测序可以此为基准,锁定病变基因,提前预防和治疗。
这次研究成果几个月前已发布在生物预印本平台,现在正式见刊Science。
具体到已发表的内容上,还存在一点不足之处:
使用的葡萄胎细胞保留的是XX染色体,缺失了Y染色体。
不过后来这段时间科学家们也没闲着,Y染色体的测序工作其实也另外完成了。
项目负责人Adam Phillippy在社交媒体宣布了这一消息,人体24条染色体基因测序已全部完成。
最新参考序列T2T-CHM13 v2.0的完整数据和在线浏览器已公开,可供全球研究团队使用。
而最新包含Y染色体测序成果的论文预印版计划在下个月发布。
论文地址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0相关数据和工具
https://genomeinformatics.github.io/CHM13v2/