在生命的道路上,你可曾感到與時間賽跑的驚心動魄?
其實,很多疾病若能“早檢查早發現”,大可将其扼殺在萌芽時期。
2019年6月,阿裡巴巴的醫療AI學會了心血管識别技術。它能從CTA影像中精準提取冠脈血管,效率比傳統方法高出近百倍,僅需0.5秒即可完成檢測。
醫學影像診斷是醫療AI的熱門應用方向,影像診斷的疾病譜系異常寬闊,遍及肝、肺、骨、乳腺、甲狀腺、心髒等器官,心血管是其中公認的高難度領域,少有玩家能夠觸及。
抵達心髒之前,阿裡先後創下肺結節檢測、肝結節診斷技術的世界級突破。兩年時間從肺、肝到心血管的“三級跳”,使得阿裡AI進階為醫學影像AI領域的“全壘打選手”。
阿裡AI正以肉眼可見的速度朝着“全器官”識别的終點線進化,阿裡的肺結節檢測、骨科輔助診療等新技術都已落地商用。
一旦在橫向的疾病譜系和縱向的技術落地上都形成突破,醫療AI就将驅動影像科的技術變革。
沒有影像學就沒有現代醫學
沒有影像學就沒有現代醫學,倫琴發現X射線之前,我們無法透過皮肉看清自己的骨骼和器官——如果不考慮人體解剖的話。
現在,典型的影像科工作圖景出現在全世界的醫院,一群醫生盯着一堆電腦,每天數以千計的圖像從醫生眼底劃過。在中國的大醫院,影像科醫生每個工作日與電腦對視的時間常常超過10小時。這群人就是醫院的視力窪地。
人是肉做的,大量機械重複動作消耗了精力和智力,也成為誤診和漏診的原因之一。
新的技術變革正在發生,人工智能敲響現代醫學的大門。全球每年産生萬億GB數量級的醫學影像,如果能讓機器輔助醫生處理片子,多少智力資源将被解放,醫生能做更多重要的事,比如多分一點時間給病人。
這是個“望山跑死馬”的願景,看着不遠,出發了才知道有多難。
針對個别器官、個别病種,AI尚且可作單點突圍,但如要對各類器官全線取勝,對資料、算法、算力的要求就要提升幾個量級。
同時,醫學診斷是一套體系自洽、程式複雜并且不無驕傲的鍊路,新技術要嵌入其間,面臨比其他場景難得多的落地關卡。
醫療AI為什麼紮堆肺結節領域?
肺結節檢測是目前人們最熟悉的醫學影像AI領地。
惡性良性腫瘤開始的時候可能隻是一個結節。但很多肺癌病人在初次就醫時,得到的判處就是晚期。
對抗這個頭号惡性惡性良性腫瘤,最好早發現、早診斷、早治療,可肺結節不容易被察覺,早期結節大多不到10mm,一般不會引發明顯不适,很多人是以錯過了最佳治療時期。
比起潛在患者數量,影像科能夠消化的病例遠不及社會需求。拍攝胸部CT篩查肺結節,每個病例的CT 影像數量超過200張,一個醫生每天最多處理幾十例影像。高強度的疲勞戰下,人工操作的誤差不可避免。這是人工智能發揮價值的理想場景。
2017年7月,阿裡AI在國際權威的肺結節檢測大賽LUNA16上打破世界紀錄,憑借89.7%的平均召回率(在樣本資料中成功發現結節占比的比例)奪冠。
LUNA16官網排行
大賽要求參賽隊伍在888份肺部CT樣本中尋找肺結節,樣本包含1186個肺結節,75%以上都小于10mm。阿裡AI全程不用人工幹預,自動讀取病人的CT序列,直接輸出檢測到的肺結節。
2017年在人工智能業界有“肺結節年”之稱——目前已知的大部分AI肺結節檢測技術突破都發生在這一年。如今,光是國内公司就有至少幾十家宣稱實作了肺結節檢測算法。
肺結節檢測成為醫學影像AI的入門級領域,算法門檻上的原因有二,首先肺結節影像相對“易讀”,影像畫面直覺、幹擾因素少、特征規律可循;其次與肺結節相關的公開資料多,擷取便捷,機器訓練成本較低。
遺憾的是,對不少醫療AI來說,肺結節既是起點,也是終點。
從肝、肺到心血管,阿裡AI的“三級跳”
想要打通醫學影像疾病譜系,必須祭出硬通貨——算法。
2017年之後,阿裡AI繼續高速奔襲,連續拿下肝結節診斷和心髒冠脈提取的兩項世界頂級賽事冠軍,宣示了在算法領域無可匹敵的優勢。
2018年12月,阿裡AI從近百支隊伍中脫穎而出,在全球LiTS(Liver Tumor Segmentation Challenge,肝髒惡性良性腫瘤病竈區CT圖像分割挑戰)獲得兩項第一。
肝髒是人體管狀物分布最密集的器官,内含門靜脈、肝靜脈、肝動脈、膽管系統等多套管狀系統。肝結節形态多樣,結節間灰階分布差異大,與周圍組織灰階相似甚至沒有清晰的邊界,對AI的“視力”挑戰大于肺結節。
阿裡AI通過對CT圖像層間資訊和層内資訊融合的網絡結構分析解決了肝結節類别多樣性的問題,用到了基于原子卷積的空間金字塔池化(Atrous Spatial Pyramid Pooling)、亞像素卷積(Sub Pixel Convolution)等技術。目前,阿裡團隊正進一步研究如何判斷肝結節的良惡性。
半年後,在2019年的心髒冠脈中心線提取鹿特丹比賽(Rotterdam)上,阿裡AI獲得全自動提取賽事第一名,相關論文被國際頂級醫學影像會議MICCAI 2019提前接收。
從CTA影像中準确提取心髒冠脈中心線是冠心病影像診斷的必備條件。通常的流程是,醫生根據二維圖像對血管進行三維重建,形成曲面重建視圖,手動提取冠脈血管,尋找并标注血管斑塊,判斷血管病變性質,進而确定治療手段。
心髒冠脈平均長度164mm,幾何特性複雜、血管特别細小。比起肺結節的靜态掃描圖像,為不斷跳動的心髒作三維圖像重建棘手得多。傳統的心髒冠脈中心線提取方法大多存在人工互動多、耗時長等缺點。
阿裡AI提出了判别式冠脈追蹤模型,三維卷積神經網絡構成的模型,充分利用三維空間特征,從影像中疊代搜尋完整血管,無需人工互動,提取單根冠脈血管平均耗時0.5秒,提取完整冠脈樹用時不超過20秒,相比傳統方法效率提升近百倍。
心血管疾病診斷的複雜性,導緻AI醫學影像識别在該領域應用極少。阿裡的技術突破,讓AI輔助醫生進行心血管疾病診斷的未來變得近在咫尺。
從肺、肝到心血管的“三級跳”,姿态有多輕盈,算法就有多厚重。算法突破沒有捷徑,拼的就是人才濃度。事實上,阿裡達摩院已經悄然聚齊國内最強AI研發者陣營——達摩院現有10位IEEE Fellow、20多位知名大學教授,一半以上科學家擁有名校博士學曆。
奪冠以後,阿裡AI還做了這兩件事
光有算法遠不足以推動技術落地。算法模型與現實場景的結合才是難點,具體到醫療AI,需要解決的問題很多,比如,如何在真實醫療環境中證明模型的準确率,如何解決真正的臨床關切問題,如何确立服務模式和商業模式。
比起LUNA16奪冠,阿裡在2017年做的另外兩件事,更能顯示其打法思路。
當年3月底,阿裡雲聯合英特爾、零氪科技發起第一季“天池醫療AI大賽”, 以肺結節智能識别和診斷為課題,開展肺癌早期影像診斷的應用探索。16家三甲醫院的醫師組成專家指導團,來自20個國家的2887隊伍報名競技,整個賽程長達半年,部分優秀算法最終轉化為了實際解決方案。
三個主辦方各司其職,阿裡雲提供機器學習訓練平台,單點支援數百GB記憶體,每次疊代可高速處理32張以上128x128x128甚至更大規模的3D圖檔;英特爾提供由第二代強融核處理器打造的高性能計算叢集,保障高強度算力供應;零氪聯合16家醫院提供全球最大規模的2000份“科研級胸部CT資料集”。
這場非商業賽事動員了整個行業的智慧,推動肺結節檢測的算法優化和技術沉澱。但它更重要的價值在賽事榜單之外——讓專業醫師與算法工程師走到一起,探讨影像學與AI的協作方式,從算法層面就關注AI嵌入醫學流程的可行性。
“開放”一直是阿裡追求的AI産業生态。阿裡的AI平台能為中小企業提供人工智能基礎設施和AI算法包,包括标準算法接入、運作環境托管、線上線下資源對接等服務,幫助企業快速低成本的建構專屬智能應用。
不論以領路者身份做東辦賽,還是在後方提供基礎設施,都符合阿裡一貫的平台思維和生态打法。也許是得益于這種開放思路,阿裡的AI工程師總能比别人更早發現産業痛點,更懂得以需求為導向推動産品創新。
比如,AI肺結節檢測準确率逼近理論極值,但為什麼醫生們并不感冒?甚至有醫院同時部署多個公司的多種算法,但并不特别依賴任何一種。
答案也不複雜,單項的肺結節檢測技術,即便在真實場景中的表現不輸于實驗室,也無法提升影像科醫生的整體效率。肺部疾病種類多樣,肺結節隻是其一,醫生閱片不可能隻排查這一種,機器不能真正減輕醫生負擔。
基于這樣的判斷,阿裡團隊在肺結節頂級賽事奪冠之後,馬上投入了肺部綜合診斷方案的研發,實作對六種常見肺部病變的影像診斷:肺密度增高影、肺索條、肺大泡、動脈硬化、淋巴結鈣化和肺結節。綜合方案涵蓋了大部分肺部疾病的早期篩查,不論對于醫院影像科還是體檢機構,都有非常現實的作用。這項技術現已認證阿裡雲對外輸出,累計服務近千萬使用者。
醫學內建了人類這個物種最大的自負和自卑,我們一方面相信,這門憑借代際智慧和臨床經驗立身的專業充滿不可言說的經驗性,沒有誰能比人做得更好;另一方面我們深知,我們對自己身體的了解非常有限,機器又如何能懂得更多?
沒人懷疑AI醫學影像符合未來醫學的發展趨勢,但研發者們仍要不斷證明AI的價值,讓醫療AI的服務模式跟上技術進步的節奏。