作 者丨武瑛港
编 辑丨朱萍
图 源丨图虫
近期,国家癌症中心发布的中国最新癌症报告《2016年中国癌症发病率和死亡率》(报告覆盖约3.8亿人,占中国总人口27.6%,因为全国数据收集、整理和核查等需要大量时间,因此报告通常会延迟2~5年)显示,2016年大陆共新发约406.4万恶性肿瘤病例,平均每天有1万余人确诊癌症,每分钟7人确诊,其中82.8万人被诊断肺癌,近66万患者去世,分别占所有癌症的20%和27%以上。
但在癌症发病率和死亡率居高不下的情况下,新药研发却遇到了阻碍,研发成本高、周期长、回报率低已成为掣肘制药企业新药开发的三座大山。
据《Nature》杂志报道,新药研发成本快速增长,2018年平均成本约26亿美元。艾昆纬曾发布报告指出,新药从临床试验开始到研发结束的平均开发时间在过去10年里增加了26%,2018年达到12.5年,但是开发成功率不断下降,2018年降至11.4%。
另有数据显示,新药投资的回报率正在不断下滑,十年前投入研发的每1美元都有10美分回报,而如今其收益不到2美分。2017年全球前12大制药公司的研发投资回报率仅为3.2%,较2010年的10.3%下降7个百分点。
值得关注的是,人工智能(AI)的迅速发展为新药研发提供了新思路,2020年1月,全球首个由AI设计的候选药物进入I期临床,新药研发也正式进入 “AI制药元年”。那么AI到底能为新药研发提高多少效率?节约多少成本?
“AI+药物创新”市场火热
据了解,目前AI的应用场景覆盖前期研究、药物发现、临床前研究、临床试验等阶段,例如前期研究应用场景为文献数据整合分析、新药研发知识库建设等,药物发现应用场景为靶点发现、晶型预测、化合物筛选等。
市场研究公司TechEmergence研究发现,新药研发搭载人工智能后速率提高2%,高盛集团也在报告中指出,人工智能技术成熟后有望在新药研发领域每年降低280亿美元成本。
从2020年开始,AI在药物研发领域的热度不断上升。
2020年1月,英国AI制药企业Exscientia与日本住友制药合作的、全球首个由AI设计的候选药物进入I期临床。
2020年3月,礼来与AI制药公司AbCellera合作开发新冠中和抗体bamlanivimab,AbCellera公司筛查了超过五百万个免疫细胞,识别出超过500个独特的全人源抗体序列,同年11月9日,该药物获得美国FDA的紧急使用授权(EUA)。
根据智研咨询数据,2020年,国内AI+制药领域融资金额达30亿元,同比增长355%,2021年热度继续上升,融资金额达到 79亿元,较上年增长49亿元,同比增长164%。据相关报道,有业内人士分析,国内AI制药这一波创业浪潮,主要是由TMT基金主导,涌进来的热钱很大一部分源自TMT基金。
国际市场同样火热,2021年全球Al+制药产业共发生77起融资事件,较上年增加24起,同比增长45.28%;累计融资额达45.64亿美元,较上年增加27.56亿美元,同比增长152.43%;融资事件数和融资额共同刷新了历年融资纪录。
2022年1月,赛诺菲宣布将与AI制药Exscientia合作开发多达15种肿瘤和免疫学领域的候选药物,交易金额高达52亿美元,“AI+药物研发”再次引起广泛关注。
尚未带来革命性的突破
那么AI到底给新药研发带来什么程度的改变和突破?
根据《药学进展》杂志发布的相关研究,AI能一定程度上助力药企降本增效,但是从已开展的应用实践来看,AI不是“灵丹妙药”,不能在一夜之间提高临床试验的效率,当前AI技术尚不能为提升新药研发效率带来革命性的突破。
医药产业高级分析师孙翔宇也向21世纪经济报道记者表示,AI技术目前在新药研发中尚未达到预期,药企要看到AI在研发中的实际作用才愿意付费。
“之前人工智能处于新兴技术的概念阶段,和传统研发模式相比,人工智能的确是新思路,但目前人工智能还没有达到行业预期,真正在应用层面的突破性案例还很少。AI医药研发企业越来越多,但药企也越来越务实,只是理念好,药企不一定愿意付费,AI企业必须拿出来实打实的东西,让药企看到AI真的有用才行。” 孙翔宇表示。
中国科学院院士蒋华良等研究人员曾分析,总体来看,大数据与AI技术在新药研发领域的前景是光明的,不过受限于生物学的复杂性和临床数据库的缺乏,这些技术主要应用在药物发现阶段,临床试验是目前AI应用的“卡脖子”环节。
孙翔宇向21世纪经济报道记者指出,药物发现阶段的先导化合物筛选,是目前人工智能影响较大、应用场景较为集中的环节,传统的筛选方法主要靠人工筛选耗时耗力,有很大的资金成本,如果能够先通过人工智能进行模拟和计算,然后再靠人工去优化,效率可能更高。
根据相关研究,几十年来,确定潜在的候选药物一直是高通量筛选(HTS)——将致病蛋白与预先合成的类似药物的化合物储存在一个化学库中,显示出强烈信号的化合物将被进一步定性和化学修饰,往往需要较长的时间和成本。
而AI技术可以建立虚拟药物筛选模型,快速过滤“低质量”化合物,检索更快、覆盖范围更广,利用机器学习技术,从海量化合物中挑选出高潜力候选药物。
但Nano Magazine曾发布一篇文章分析指出,在药物发现阶段,人工智能有三方面问题:第一,人工智能被困在已知的数据边界内——可以从已知数据中学习,在领域内预测,但不具备领域外表现良好的能力;第二,在药物发现中,人工智能需要有效药物的数据,也需要不起作用的数据,但后者在公布的生物科学文献中基本不存在;第三,大多数生命科学研究结果是不可重复的,那么任何基于数据的人工智能预测都是值得考量的。
和小分子相比,AI在大分子领域的进展更加艰难,据了解,蛋白质大分子不同三维结构造就不同功能,但蛋白质结构预测十分困难,通过氨基酸序列就可以预测蛋白质结构和功能是很多生物科学家的梦想。
值得关注的是,2021年,《Science》杂志公布年度科学突破榜单,谷歌AI团队预测蛋白质结构的人工智能技术AlphaFold位列榜首。2021年7月,《Nature》杂志发表文章,AlphaFold2破译了98.5%人类蛋白质,其中58%单个氨基酸位点的预测结果达到了足够的可信度,36%预测结果能为药物研发提供详细原子特征。
峰瑞资本合伙人马睿曾表示,AlphaFold完成了0到1的过程,把从序列到结构的预测解决得不错,但是从结构到功能的预测尚未被研究透彻,更理想的情况实际上是反过来——给定靶点后,直接设计大分子序列,能和靶点结合,或达到特定生物功能,这些离应用层都还有一定的距离。
Nano Magazine发布文章分析称,进化规则制约着蛋白质空间结构,近几十年来人们还收集了大量实验数据,这些为人工智能技术的应用创造了完美的环境。但相比之下,药物发现是一个真正不同的环境,关于蛋白质和药物结合的现有数据非常稀少,而且往往不可靠。
培养复合型人才之难
据了解,目前AI也临着数据的挑战,孙翔宇向21世纪经济报道记者指出,在合作中,最核心的数据药企可能不愿意分享出来,即使数据分享出来,也不见得就能用好——化学药分子量小、结构明确、比较容易运算,数据积累也多,可能更契合AI应用思路;但生物药分子量较大,立体结构复杂,而且只有数十年的开发历史,数据量积累还不是特别多。
根据《药学进展》杂志发布的相关研究,生物学的复杂性给数据获取和AI算法设计带来巨大挑战。
因为药学融合了化学和生物学,两者在数据层面有较大差异。一般来说,化学方面的数据更加稳定可控、易于计算,生物学数据涉及受体蛋白的多种信号,难以定量计算,而且化合物与人体靶点的结合与反应过程非常复杂,目前理论认知不足,受环境影响因素很大,数据稳定性和可重复性较差。
另外AI还受到高质量数据制约,大陆的医药大数据存在数据量少、数据体系不完整、数据标准不统一、数据共享机制不完善等问题,例如病历、随访记录目前很难标准化、数字化,临床数据由于涉及患者隐私难以灵活运用等。
中国药科大学国际医药商学院副教授柳鹏程认为,不论数据多少、数据有多复杂,随着技术的更迭总会有办法解决,目前的最大问题在于缺少推动技术发展的复合型人才。“通常药学专业科研较强的高校,计算机专业并不是优势专业,反之亦然。交叉性学科发展薄弱,复合型人才的培养缺失,是制约行业发展的大问题。”
根据相关数据,全世界大约有2.2万名AI领域高端研究人员,而在中国只有约600名,人才需求缺口较大。
柳鹏程向21世纪经济报道记者表示,其实很早之前就有计算机辅助药物设计的专业,涉及简单的编程,但“AI+药物研发”是交叉学科,要有学科碰撞,只有单方面学科优势的学校缺少条件,只有在综合性大学里才可能实现大范围突破,但国内在交叉学科的人才培养方面有所欠缺,背后可能涉及人才培养方式的问题。
“现在药学人才多是纯粹传统药学出身,很少有其他专业背景,读博士都是本科读药学、研究生读药学、博士依然读药学,很少有学生能够在攻读研究生期间选择计算机专业,因为一个学科的知识本来就很多,如果有两个学科背景,知识体系更加复杂,培养难度也会增加,这与中国高校的专业化培养模式有关。” 柳鹏程指出。
商业模式如何走通?
虽然困难重重,但AI制药企业仍要生存和发展。
在孙翔宇看来,商业模式决定了AI企业是否能活下去,目前有三种模式,第一种是AI企业建立平台让药企使用,提高新药研发的效率,类似向药企销售一款软件,第二种是与药企签署合作协议,一起研发药物,第三种是AI企业自己研发新药,然后卖给药企。
目前这些商业模式都还处于探索阶段,有待市场的验证。对于第一种,药企的付费意愿其实不太高,而且药企数量有限,AI企业每一年的营收有天花板,第二、第三种模式风险在于前期没有现金流收入,需要依靠融资支持,而且AI企业自身缺少医药人才和临床试验能力,独立研发只能全靠外包,模式就像“小Biotech”。
根据火石创造分析,“AI+药物研发”的商业模式尚不明确,AI药物研发真正意义上的产出较少,2019年4月,IBM公司因为财务业绩低迷,决定停止开发和销售药物开发工具Watson人工智能套件。目前多数企业发展依赖融资,对AI+药物研发技术创新企业来说,是自己做药物研发还是CRO模式,是需要结合自身发展做出适合的选择。
另有分析显示,人工智能在药物研发方面的快速发展,可能会导致监管端法律法规有所滞后。
不过,孙翔宇指出,目前AI在新药开发中的应用没有特别大的监管障碍,因为审评审批部门主要看药物最终的安全性和有效性,而不是看使用哪种研发方法,但是在AI企业和药企合作过程中,如何做好双方知识产权的保护,可能是需要考虑的问题。
柳鹏程也表示,人工智能是方法论层面的问题,而监管端重点还是在于结果的安全有效性。但如果将AI用于患者用药方案的预测,监管就会十分重要——如果AI被事先加入了具有歧视性的算法,对富人和普通老百姓差异对待,那么将是不公平的,但AI算法具有不透明性,根本不知道AI是用什么规则、如何计算,所以监管难度会非常大。
算法不透明或许也是AI制药企业在药物研发中要面对的问题,有研究显示,人工智能算法输出结果难以预测与解释,缺乏透明度,研发人员无法知晓虚拟筛选所得小分子药物优先排位的缘由与依据,可能连设计者都无法解释,即“黑箱现象”。然而人工智能的准确度和透明度恰恰成反比,准确度越高,透明度就越低,要解决黑箱问题需要在两者间进行权衡。
“以前写程序,是通过‘if else’条件语句等制定算法规则,计算机根据规则去跑,但AI是不需要写规则,只需要给AI提供大量数据,不断训练,AI就可以自己构建出一套规则,这是AI的优势,也是它的问题。”柳鹏程表示。
柳鹏程进一步指出,虽然AI在药品研发领域尚未产生革命性改变,还不能取代传统方法,但是未来肯定会产生重大影响,“人工智能的发展就像我们在站台看火车,远远听到声音,就是看不到火车,但是火车一旦到来,将会在你面前飞快驶过,把你远远地甩在身后,只留下一阵风。”
本期编辑 冯展鹏 实习生李凯琳