| 導語 近期騰訊AI Lab醫療AI中心和南方醫院合作發表一項基于病理圖檔預測微衛星不穩定性的可解釋深度學習模型研究成果,助力分子病理和精準醫療的研究。
微衛星不穩定性(Microsatellite instability,MSI)是一種基因組不穩定的表型,發生在DNA錯配修複缺陷(dMMR)的惡性良性腫瘤中,據報道是遺傳性林奇綜合征(LS)相關癌症的标志。MSI已被确定為II期結直腸癌(CRC)輔助化療的有利預後因素。更重要的是,最近的研究表明,MSI或dMMR與增加的新生抗原(Neoantigen)負荷相關,這一特點使惡性良性腫瘤對免疫檢查點封鎖(ICB)治療敏感。進一步的研究表明,ICB治療對MSI患者的益處并不限于特定的惡性良性腫瘤類型,而是對所有實體瘤都有益,這使MSI在預測免疫療法對晚期實體瘤(尤其是CRC)的治療效果中能夠發揮關鍵作用。
最近,美國食品藥品監督管理局(FDA)已經指定MSI / dMMR作為PD-1治療的有利預測名額之一,臨床上對MSI / dMMR測試需求急劇增加。然而,在臨床實踐中,并非所有患者都接受MSI測試,因為需要進行額外的基因測序或dMMR相關蛋白免疫組化測試。而且上述兩類分析具有較高成本,并未在臨床上完全普及。此外,各種現有的MSI測試方法表現出不同的敏感性和特異性,往往導緻結果不一緻,并沒有一個統一的标準。是以,開發适用于所有癌症患者的MSI測試方法充滿了機遇與挑戰。
計算病理學的出現為檢測MSI提供了全新機會。病理切片作為癌症診斷的金标準,在臨床診斷中應用廣泛且易收集,在不同醫院病理科的制片和染色的标準趨于統一和規範化,且成本較低。病理切片經過掃描成為數字化圖檔(Whole slide image,WSI)後,在低放大倍數下可顯示惡性良性腫瘤細胞的組織空間排列,而在高放大倍數下可顯示細胞結構,組織病理學圖像還可顯示惡性良性腫瘤的免疫微環境。WSI中顯示的細胞水準表型在分子水準上受基因型(例如MSI)的調控。然而在基于人工智能(AI)的資料解讀和分析過程中,由于病理圖檔本身過大,目前計算資源還很難支援将整張圖檔直接用于深度學習,是以通常基于多示例學習(Multiple instance learning, MIL)的架構對問題進行模組化。具體的過程為:首先将整個WSI切為多個區塊(patch),随後對每個patch進行分析并提取相應特征,然後将一個病例的所有patch資訊綜合,産生整個病例的特征表達,最後基于整體的特征表達預測最終的結果。
本工作着力于研究基于病理切片的MSI自動預測技術,開發了基于多執行個體學習(MIL)的深度學習模型,有效地結合了一個病例的所有patch資訊,并獲得了對MSI預測的高準确率。此外,本工作提出的方法有機地結合了深度學習和傳統機器學習技術并利用內建學習進一步提升了效果。
本工作提出的方法對于結直腸患者的微衛星不穩定性均有比較準确的預測效果,超過了現有其它方法,并在不同分期的結直腸癌患者中都具有良好的表現。
另外,模型算法是在TCGA公開資料集上來訓練研發(白種人,冰凍切片),而未來在臨床上的應用場景是對來自中國病人進行準确預測(黃種人,石蠟切片)。針對資料集之間存在的差異,我們利用了遷移學習有效提升了模型針對不同資料集的預測效果,并在外驗資料集上進一步驗證了模型的泛化性能。鑒于模型算法在結直腸病人WSI預測中取得的優異性能,我們也進一步探索了模型算法對其它癌種的适應性,實驗結果表明在胃癌等其它癌種中所提模型同樣取得優于現有其它方法的效果,顯示這一模型的具有廣闊應用前景。
近來,深度學習的可解釋性獲得了越來越廣泛的關注。一個決策機制清晰且習得特征可解釋的深度學習方法有利于提升其在醫療應用中的可接受程度。對此,我們對深度學習提取的相關特征和病例對應的基因、轉錄和免疫分子進行關聯分析,并基于此解釋了與MSI預測相關的基因突變和生物學進化過程。
進一步分析表明,病理圖檔中的分化程度與MSI結果有顯著相關性,具有統計學意義。此項發現可以進一步指導臨床實踐,并提升醫學專家對病理圖檔和MSI相關的了解。
我們在算法設計過程中考慮到了其在醫院環境下的實用性與可得性。測試表明,我們提出的算法模型對單個病例的WSI圖檔使用GPU工作站可以在0.5118s内完成預測,而使用正常的CPU則可以在20.9291s内完成預測。該方法簡便快捷,易于部署和操作,在臨床一線預測具有廣闊前景。為了便于廣大臨床醫生使用,幫助MSI的檢測,團隊已經将模型在Github開源。
本研究《基于病理圖檔的結直腸癌微衛星不穩定性預測模型的開發和解釋》,是南方醫院與騰訊公司合作的成果之一,第一作者分别是南方醫院副院長曹瑞博士、騰訊AI Lab醫療中心進階研究員楊帆博士和趙宇博士等,南方醫院劉莉教授、騰訊AI Lab醫療中心負責人黃俊洲博士、騰訊AI Lab醫療中心首席科學家姚建華博士和南方醫院董忠誼博士均為共同作者。該成果以研究長文的形式發表在醫學一區期刊診斷學(Theranostics)上面,該期刊是臨床診斷學Top1。該方法是醫療AI中心探索的又一成功案例,并獲得行業專家認可。
騰訊 AI Lab 于2017年開始AI+醫療探索,不斷拓展和深化研究與應用,涵蓋影像篩查、病理診斷、藥物研發多個領域。在研究領域,騰訊AI Lab論文多次入選 CVPR、MICCAI、RSNA等頂級學術會議,并且與鐘南山院士團隊合作發表抗擊新冠肺炎算法,研究長文發表于自然通訊雜志,自研算法獲得國際級權威測試平台冠軍等。在應用領域,騰訊AI Lab深度參與并主導推動多項應用落地,包括為騰訊的國家級影像産品「騰訊覓影」與輔診導診産品醫療科普平台「騰訊醫典」提供了支援,聯合合作夥伴研發的中國首款智能顯微鏡獲藥監局準許進入臨床應用,釋出AI驅動的藥物研發平台「雲深智藥」等。在國家新基建的背景下,騰訊AI Lab發揮大資料挖掘與機器學習等先進技術優勢,推動AI與醫療産業的深度結合,助力社會整體醫療健康水準提升。
Automl架構katib淺析
如何讓視訊會議在小程式上開起來