天天看點

新冠病毒破解有了巨大突破,達摩院做了什麼?

​阿裡巴巴達摩院正在用AI算法抗擊新型冠狀病毒肺炎疫情。2月1日,浙江省疾控中心上線自動化的全基因組檢測分析平台。利用阿裡達摩院研發的AI算法,可将原來數小時的疑似病例基因分析縮短至半小時,大幅縮短确診時間,并能精準檢測出病毒的變異情況。

新冠病毒破解有了巨大突破,達摩院做了什麼?

達摩院算法專家顧斐博士在疾控中心基因檢測分析現場

目前,全國新型冠狀病毒肺炎疫情依然嚴峻,快速、精确診斷對于疫情控制尤其重要。公開資訊顯示,該病毒是基因組序列最長的病毒之一,全基因組序列全長29847bp,臨床診斷需要将患者樣本與該病毒基因序列進行比對才能确定診斷結果。

目前醫院普遍采用核酸檢測方法,其隻能檢測到病毒基因的局部。由于病毒存在變異的可能性,對于整個基因序列來說這種檢測方法猶如盲人摸象,一旦病毒發生變異,就可能出現漏檢的情況。

新冠病毒破解有了巨大突破,達摩院做了什麼?

新型冠狀病毒結構

不同于傳統核酸檢測方法,全基因組檢測技術可以對疑似病例的病毒樣本進行全基因組序列分析比對,能夠有效防止病毒變異産生的漏檢。此次阿裡巴巴達摩院與傑毅生物技術公司聯合研發的平台采用的就是全基因組檢測方法,其突破之處在于大幅縮短了檢測時間。

在基因分析階段,阿裡巴巴達摩院和阿裡雲彈性計算團隊提供的系統還能提供病毒快速拼接能力,将快速精準捕捉變異後的病毒序列,二級結構及三維結構,為病毒疫苗和藥物提供了基礎。

新冠病毒破解有了巨大突破,達摩院做了什麼?

設定基因檢測分析參數

診斷效率的提升得益于算法的創新。達摩院團隊針對新型冠狀病毒基因進行特征分析,并推出多個算法模型。在序列比對過程中,達摩院對算法增加了分布式設計,提升了比對效率;在病毒序列拼接階段使用分布式設計的de Bruijn圖算法,變異病毒也能精準檢測。

浙江省疾控中心基因測序負責人孫逸博士表示:“該平台基于阿裡雲的強大算力與達摩院新算法可以為病毒的解析提供支撐,基于該平台,未來還可以在短時間内将檢測範圍覆寫整個确診病例,也為後續疫苗與藥物研發打下了堅實基礎。”

以下是達摩院算法專家對該平台的解讀:

Q:這一平台有何特點?

A:此次研發的自動化全基因組檢測分析平台屬于高通量測序,平台由阿裡巴巴達摩院聯合傑毅生物共同研發,可以給浙江省疾控在新型冠狀病毒疫情防控上提供了全自動建庫和分布式計算分析能力。傑毅生物開發了全自動高通量測序建庫儀,把整體正常人工需要12小時的工作縮短到2個小時。每次測序過程會産生海量的資料,達摩院采用分布式設計的分析算法,樣本基因分析的速度由數小時縮短到半小時;同時,由于采用分布式算法,病毒拼接的速度由30分鐘-1小時縮短到15-30分鐘。除此之外,不同于傳統核算檢測方法,這一平台還可以檢測到病毒的全貌,避免因為病毒變異造成的漏檢情況。

Q:達摩院團隊提供的算法有哪些價值?

A:達摩院針對新冠病毒基因的特征進行了分析,基于pdb等公共資料集的資料進行算法的優化訓練。本次分析病毒檢測和病毒變異部分主要基于開源算法,設計分布式算法以加速分析流程。病毒序列拼接完成後,通過設計BiLSTM+DNN的方式訓練模型預測病毒蛋白二級結構。同時,達摩院還在研究基于序列的蛋白質三維結構預測模型以及藥物篩選模型。

繼續閱讀