天天看點

在癌症治療這件事上,要不要相信人工智能?

随深度學習技術的應用與成熟,人工智能也在不斷拓展疆界。跨越傳統的語音、圖像、資料挖掘等強相關領域,人工智能正不斷與物流、教育、金融等領域碰撞出新靈感。

在醫療領域,人工智能的應用往往表現為輔助診斷或者影像檢測的「輕」應用,如輔助影像診斷醫生篩查早期惡性良性腫瘤,或是幫助完成病例電子化、流程無人化。

也許在藥物開發和藥物選擇這樣的「重」領域上,人工智能同樣能發揮不俗的作用。

新時代的 Lipinski Rule of Five

1997 年,輝瑞公司資深藥物化學家 Christopher A. Lipinski 分析了 2,000 多種二期臨床後的藥實體化特征,總結出了四條非常具體的結論。如果一個化合物違反其中任何兩個,将可能面臨水溶性或透膜性差的問題:

氫鍵給體(連接配接在 N 和 O 上的氫原子數)數目小于 5;

氫鍵受體(N 和 O 的數目)數目小于 10;

相對分子品質小于 500;

脂水配置設定系數小于 5。

因為都與 5 相關,這些規則被稱為 Rule of Five(RO5)。很快,RO5 成為藥物化學家設計藥物前必須考慮的因素。

事實上,水溶性或透膜性隻是藥物設計過程幾十個障礙中的兩個。2008 年,銷量前 10 名的小分子藥物中,隻有 4 個完全符合 RO5。作為「經驗法則」(Rule of Thumb),憑「肉眼」總結、被奉為藥物研發圭臬的 RO5,并不能概括藥物的全部特征。

在癌症治療這件事上,要不要相信人工智能?

Rule of Thumb 來源于用拇指測量木材的木工,指代「使用廣泛、但非絕對精确的原則」

「我們認為制藥的規則不應該『腦袋一拍』就提出。一個人能見過 1,000 種藥物,但不可能見到 10,000、100,000 萬種,機器可以做的比人好。」

對于以往随機發現的藥物研發方式,人工智能的加入也許能讓「大海撈針」變成「有的放矢」。來自 Accutarbio 的創始人範捷博士,大學畢業于複旦大學生命科學院,碩士就讀于加州伯克利分校。博士師從 Nikola Pavletich,期間解析了 RPA-DNA 複合物晶體結構;博士後師從 99 年諾貝爾醫學獎獲得者 Günter Blobel,解析了核孔小體複合物的相關結構。他相信人工智能與實驗驗證相結合 (hybrid-method),可以加速新一代靶向治療藥物開發,也可以為癌症病人提供更多可選擇的治療方案。

在癌症治療這件事上,要不要相信人工智能?

AccutarBio 官網上,創始人範捷的資訊

病人使用藥物的目的,是改變緻病蛋白質的構象,讓其被「鎖住」停止「作惡」,或者幹脆降解消除它們。這也是制藥的基本原理——藥物像一把開鎖(治療)的「鑰匙」,制造鑰匙的方法是了解「鑰匙孔」(緻病蛋白質)的準确形狀(構象)。

想要獲得蛋白質的構象資訊,傳統的方法是通過實驗。但這種方法的局限也很明顯,一方面蛋白質晶體難以培養,另一方面實驗中得到的都是在一定條件下瞬間、片面的結構資訊;另一種方法則是計算方法,即通過統計學規律,計算出某種情況下蛋白質的結構情況。

AccutarBio 顯然選擇了第二種。通過運用機器學習方法,學習大分子晶體結構資料庫(Protein Data Bank,PBD)中全世界研究者上傳的蛋白質、核酸的 X 光晶體衍射、NMR 核磁共振結構資料,AccutarBio 可以在準确描繪鑰匙孔形狀、選擇氨基酸構象這件事上,給出比目前行業好得多的算法。

有了鑰匙孔的形狀,配鑰匙就變得有迹可循。這套算法可以畫出鑰匙孔中每個氨基酸的構象、蛋白與蛋白互相接觸表面的氨基酸構象,在預測「鑰匙孔」周圍氨基酸位置、鑰匙擺放方法和位置構象上,可以提供更高準确性。

目前,AccutarBio 的藥物與靶點蛋白的結合模式預測(docking),即為鎖「配鑰匙」的過程,在準确度和速度上都較行業藥物設計領頭羊 Schrodinger 有顯著提升。「我們的預測更準确的原因,在于使用了基于資料的算法。與正常基于經驗和大量實體學假設的方法相比,在資料量足夠大時具有明顯優勢。」

在癌症治療這件事上,要不要相信人工智能?

可前往 AccutarBio 的官網檢視相關視訊示例

與市面上通過調參來預測、設計藥物的方法不同,AccutarBio 的算法沒有為不同藥物的設計使用不同的函數和參數。「并不是把所有問題都解決,至少目前我們的方法論是用一種方法解決不同的問題,這樣才有說服力。」目前,AccutarBio 正在進行相關專利申請。

算法衍生的一張表格

如今聽起來耳朵長繭的「靶向假說」、「精準醫療」,其實已是醫療界相當新的想法。

19 年前,Peter Nowell 和 Janet Rowley 因對慢性粒細胞白血病(CML)研究的貢獻,獲得了「小諾貝爾獎」the Albert Lasker 醫學研究獎的認可。他們發現 CML 患者基因突變中丢失的 22 号染色體 DNA 片斷,「移位」至 9 号染色體,使兩種正常蛋白發生結合進而緻病。這項研究促成了一種新藥物的誕生——格列衛(Gleevec,伊馬替尼),這也是曆史上第一個成功的靶向治療藥物。

自 1997 年利妥昔單抗被 FDA 準許上市以來,已經有 40 多種靶向治療藥物在市面上流通。但它們僅覆寫了十幾個靶點,在人類的基因中,緻癌的基因數量的是以千為機關的。

在癌症治療這件事上,要不要相信人工智能?

2009 年,緻力于研究白血病和其他癌症發病因的 Janet Rowley 被授予總統自由勳章

藥物的缺乏也許可以用「老藥新用」的方式解決。本為治療心絞痛開發的西地那非(Sildenafil),如今已是大名鼎鼎的偉哥(Viagra);失敗的化療藥物疊氮胸苷(Azidothymidine),也曾被用來治療 HIV 病毒感染。常用藥物同樣可能對癌症靶點起作用。

藥物與靶點的對應關系還需要通過實驗不斷去試嗎?計算力的提升和機器學習提供了一種可能:用算法替代随機發現的自然科學過程。通過前文所述的算法,AccutarBio 将 FDA 認證過的 1400 多種藥物與 10000 個左右的潛在靶點進行比對計算,得出了一個巨大的對應表格。

計算發現,FDA 認證過的藥物中,沒有幾種藥物的優先靶點是它的設計靶點,大部分藥物都排在靶點對應藥物序列的幾百名左右。如果病人已經無藥可醫,也許這張表格能提供一些選擇。

盡管提供了按圖索骥的可能,對應關系的驗證仍需要大量實驗,「這張表更有指向性和預見性,把實驗的過程變得更精準」。并非将這張巨大表格當作許願神燈,範捷希望 AccutarBio 的實驗室與合作實驗室盡量将這張表格驗證填滿,「有越來越多實驗的支撐,才會真正給病人帶來更多臨床治療的選擇」。

Accutar——Accurate Targeting「精準打靶」

「算法是下金蛋的鵝。金蛋的今天是表,明天是藥,後天可以做一些不同的事情。」

把表格中較強的藥物與靶點對應關系找出來,可以直接從臨床 II 期或臨床 III 期開始藥物實驗申請認證,是這張表格的運用方式之一。範捷也在不斷思考算法和衍生表格的商業模式,不過終點都指向一個方向,「讓更多病人盡快受益」。

目前 AccutarBio 的團隊近 20 名成員,分别來自生物學、化學、計算機科學等不同背景。在上海、紐約均設有實驗室,顧問包括諾貝爾獎得主 Günter Blobel、美國國家科學院院士 Jerard Hurwitz 以及 Mount Sinai 的教授 Jin Jian。

在癌症治療這件事上,要不要相信人工智能?

「去做别人認為是風險,在我們看來是機會的事。」在學術與創業的岔路口,身為導師的 Günter Blobel 曾給過範捷這樣的指引。在創業過程中,不論學術還是融資,Günter Blobel 博士都給予了不少幫助。「他會用他的資源幫你成長,而不是和你搶功勞」,這大概是人們常說名師出高徒的原因。

師徒相協也許是人工智能領域不可忽視的特點之一。無論是在圖像識别、NLP 還是其他分支,都能循着這條規律的影子找到不少印證。人工智能大概是門檻最高的創業方向中的一個,先在學術上取得認可也許是最好的選擇,包括與其他學科的結合。

AccutarBio 已獲得天使輪融資,投資人為真格基金創始人徐小平,目前正在展開 A 輪融資。  

在癌症治療這件事上,要不要相信人工智能?