天天看點

AI真·煉丹:整整14天,無需人類參與

作者:量子位

金磊 夢晨 發自 凹非寺

量子位 | 公衆号 QbitAI

現在制藥這事,人類要靠邊站了。

坐标蘇州,這是一個1600平的制藥實驗室,它的“打開方式”是這樣的:

門口,沒有人。

AI真·煉丹:整整14天,無需人類參與

走廊,沒有人。

AI真·煉丹:整整14天,無需人類參與

實驗室,也沒有人。

AI真·煉丹:整整14天,無需人類參與

相比以往充斥着科學家、研究員的實驗室,它更多的是把機械臂和AI系統塞了進去,主打的就是一個全自動化。

或許好奇的小夥伴就要問,這樣的實驗室能幹嘛?就是為了自動化而自動化嘛?

事情當然沒有那麼簡單,你瞧見的隻是無人的操作,但在背後,AI做的可遠遠不隻是替代人工的實驗室操作那麼簡單,而是:

14天内完成靶點發現和驗證,還是全自動化幹濕實驗閉環的那種。

要知道,這個過程要放以前,可是需要足足2-3年才能完成……

AI真·煉丹:整整14天,無需人類參與

而且更為精細化的工作,例如樣本處理、細胞培養、化合物管理、高通量篩選、新一代測序、高内涵成像等等,不論是單一任務還是“關聯”任務,機器都可以在AI的控制下輕松接手。

AI真·煉丹:整整14天,無需人類參與

△用Echo 650T制備檢測闆

AI真·煉丹:整整14天,無需人類參與

△用NovaSeq 6000測序

這便是來自全球AI制藥第一梯隊的“選手”——英矽智能(Insilico Medicine)的第六代智能機器人實驗室,也是全球首個用AI參與決策的生物學實驗室。

而在它背後驅動這一切的AI大腦,則是一個叫做PandaOmics的平台,可以根據實驗的程序自主做決策、下達指令。

若是把這個AI平台單拎出來,它更是囊括了20多種預測模型和生成生物學模型,還包含遺傳學、蛋白質組學、甲基化資料、文本文獻和科研基金等海量資料,用以支援專業的靶點識别、分析和排序、适應症探索等生物學研究。

甚至已經有高中生用PandaOmics發現了藥物新靶點,并且研究成果還登上了國際學術期刊!

AI真·煉丹:整整14天,無需人類參與

而且除了PandaOmics之外,英矽智能在人工智能制藥領域擁有端到端的藥物發現平台Pharma.AI,其中專注于化學領域的Chemistry42,還可以針對給定靶點從頭設計具有特定屬性藥實體化性質的新型小分子。

這一切都可以在幾小時到幾十小時内完成,且支援并行運作多個任務。

AI真·煉丹:整整14天,無需人類參與
AI真·煉丹:整整14天,無需人類參與

以及英矽智能還将科技圈最潮的大模型也融入進來,在Pharma.AI的架構上推出Copilot系統,讓你隻要會對話就能使用專業的AI制藥平台。

AI真·煉丹:整整14天,無需人類參與

由此可見,現在AI不僅是把制藥這件事變成了“自動駕駛”模式,更是狠狠地把門檻打下去、效率提上來。

AI真·煉丹:整整14天,無需人類參與

AI制藥的流程和工作是友善了,但随之而來的一個問題便是:如此大的工作量,算力,又是如何解決的呢?

科學計算與AI,CPU都在發力

對于上述的問題,包括英矽智能在内的AI制藥頭部力量們不約而同的選擇了相似的解決辦法:

充分利用所有可以用、值得用的科學計算與AI算力平台。這種平台可不是你想象的那樣被GPU制霸,相反,其中的CPU用量更大,尤其是英特爾的CPU。

為什麼要選擇英特爾?

首要的一個原因,就是英特爾供企業計算及科學計算使用的主力CPU,即至強® 可擴充處理器系列産品,一直都是實體計算——無論是昔日計算機輔助制藥,還是今天AI輔助制藥都非常依賴的科學計算應用的關鍵承載平台。

另一方面,就算是把應用的主題從相對傳統的制藥相關的科學計算任務,切換到更偏AI的應用上,英特爾也算是頗有建樹,這一點從它對以AlphaFold2為代表的開源蛋白質預測模型的支援上就可見一斑。

AI真·煉丹:整整14天,無需人類參與

△AlphaFold2基本架構

⾸先,AlphaFold2整個端到端的處理過程,涉及⼤量複雜多樣的計算類型。從早期的資料收集、特征提取等預處理階段,到基于深度學習的蛋⽩質結構預測,再到後續的結果分析,這是⼀個⾼度異構的⼯作負載。

⽽英特爾® ⾄強® 可擴充處理器可以輕松勝任這一系列多樣化的任務。以⾄強® CPU Max系列處理器為例,它采⽤全新微架構、更多核心(最⾼達56個),能以更⾼頻率和更⼤緩存,去應對⾼通量的預處理和後處理⼯作。

它在記憶體和輸入/輸出(I/O)子系統性能上有着顯著的增強,還結合大容量末級緩存使AlphaFold2推理過程中關鍵的張量吞吐獲得了大幅提升。

AI真·煉丹:整整14天,無需人類參與

△英特爾® 至強® CPU Max 系列處理器

其次,由于AlphaFold2所采⽤的深度學習模型規模巨⼤,推理過程中的張量運算不僅量⼤,且次元極⾼。這就要求承載平台具備強⼤的AI運算加速能⼒。

在這⼀點上,新款⾄強® 系列處理器内置的英特爾® AMX(⾼級矩陣擴充)技術,可以顯著加速⼤規模矩陣乘法運算。

在FP32/BF16混合精度計算下,其理論峰值可達每時鐘周期1024次乘加操作。針對AlphaFold2推理任務中所需的大量矩陣運算操作,AMX_BF16能在保持較高精度的同時,提高計算速度并減少存儲空間。

AI真·煉丹:整整14天,無需人類參與

△AMX_BF16推理優化帶來更低記憶體占用和更大輸入長度

另⼀⽅⾯,AlphaFold2因其⾼維張量運算和⻓序列并⾏計算,在推理過程中常⾯臨超⼤記憶體需求,不光影響推理速度,還會限制更⻓蛋⽩質序列的預測。

為此英特爾從軟硬協同的方式給出完整解決方案。

一面是提升記憶體容量和帶寬。解決方案中,英特爾® ⾄強® CPU Max系列處理器除支援DDR5記憶體外,還內建了HBM(⾼帶寬記憶體)。單顆處理器的HBM容量⾼達64GB,且具有高達460GB/s帶寬。

另一面是提供了多種降低記憶體的軟體優化方法。如面向PyTorch對張量計算原語(Tensor Processing Primitives,TPP)技術進行擴充,以及切分Attention子產品和算子融合的推理優化方案,幫助AlphaFold2在通用矩陣乘法計算中所需的記憶體峰值大幅降低。

AI真·煉丹:整整14天,無需人類參與

△熱點算子與融合效果

經過一系列加強和優化後,最終效果如何呢?

如圖所示,在基于至強® CPU Max系列處理器的優化流程中,每個優化步驟獲得的提升累積後,獲得了相對于基線性能(對比組1,基于第三代至強® 可擴充處理器,未實施優化)高達33.97倍的通量提升。

根據測算,性能提升中的74%源自預處理階段的高通量優化,26%要歸功于對推理過程的優化。

此外,在同樣開啟IPEX(面向PyTorch的英特爾® 擴充優化架構)的情況下,相比對比組2(基于第三代至強® 可擴充處理器,但實施過優化),方案在更新使用至強® CPU Max 系列處理器後,其内置的HBM記憶體、英特爾® AMX的加成,則帶來了48.3%的性能提升。

AI真·煉丹:整整14天,無需人類參與

△切分Attention子產品和算子融合的推理優化方案

而且值得一提的是,在一項基于某公有雲服務的測試中,基于至強® CPU平台建構的AlphaFold2解決方案還在性能上獲得了遠優于某高端GPU平台的表現,同時也優于由CPU+GPU混合建構的方案。

這可是一個非常難得的成績——畢竟過去在很多AI應用的測試或實戰中,CPU能有接近或媲美GPU的表現就已經算是成功,而AlphaFold2上至強® 平台則實作了性能+蛋白質預測序列長度的全面反超。

現在還剩下最後一個問題,多個蛋白結果的解析模型AlphaFold2 Multimer。

也就是從預測單個蛋白質三維結構,發展到了對多個蛋白質分子之間的互相作用及所形成的複合體結構進行預測。

CPU在這一演變過程中的支援力度如何呢?

答案是不用擔心!

基于英特爾® 架構的AlphaFold2解決方案同樣也面向AlphaFold2 Multimer的管線結構進行了優化與驗證。

雖然後者的管線結構已根據蛋白質複合體結構預測的需求進行了調整,但英特爾AlphaFold2上的優化方案,在被用于AlphaFold2 Multimer時同樣有效。

AI真·煉丹:整整14天,無需人類參與

△面向AlphaFold2 Multimer模式的方案實作

CPU加速新藥發現不是夢

回顧以往,研發⼀種新藥動辄需要10年時間,投⼊20億美元才能起步。

AI真·煉丹:整整14天,無需人類參與

⽽在AI的助⼒下,這⼀成本正⼤幅降低。以英矽智能為例,它們進展最快的項目僅⽤18個⽉就找到了治療特發性肺纖維化(IPF)的潛在全球首創候選藥物并通過實驗驗證,總成本約為280萬美元。

展望未來,随着AI技術的進⼀步發展滲透,它必将重塑制藥業的創新模式,讓新藥研發變得更加⾼效、精準、經濟。而在這一程序中,相關的科學計算及AI應用任務,依然需要有強大的算力支撐。

從英矽智能等公司的實踐來看,以⾄強® 處理器為代表的CPU平台,正憑借其在性能、成本、⽣态等⽅⾯的獨特優勢,成為推動AI時代制藥創新的重要“引擎”。

這也預⽰着,在AI改變衆多⾏業的當下,CPU加速AI應用落地,幫助使用者節支增效以及推進其技術和業務創新的腳步從未停止。

AI讓新藥研發進⼊“⾃動駕駛”模式,⽽英特爾® ⾄強® 處理器則提供了它所需的源源不斷的動⼒。

在這種合作模式下,AI+制藥還将擦出怎樣的⽕花,就很值得期待了。

為了科普CPU在AI推理新時代的玩法,量子位開設了《最“in”AI》專欄,将從技術科普、行業案例、實戰優化等多個角度全面解讀。

我們希望通過這個專欄,讓更多的人了解英特爾® 架構CPU在AI推理加速,甚至是整個AI平台或全流程加速上的實踐成果,重點就是如何更好地利用CPU來提升AI,包括大模型應用的性能和效率。

未來随着英特爾AI産品技術組合的進一步擴充和豐富,我們還将在這裡為大家提供更多産品技術上的優秀用例與方案分享,以及技術應用指南。

更多關于基于英特爾® 架構的AlphaFold2解決方案,可點選文末閱讀原文進一步了解。

AI真·煉丹:整整14天,無需人類參與

— 完 —

量子位 QbitAI · 頭條号簽約

關注我們,第一時間獲知前沿科技動态

繼續閱讀