当下,AI正在为疫苗的加速研发提供更多方案。
《自然》正刊5月2日发表题为《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》的论文表示:百度生物计算用AI首次提升了mRNA序列的稳定性、有效性;而《自然》子刊也在5月18日发表《Using AI to create a vaccine revolution》文章称,由丹麦公司Evaxion创立的AI平台使药企能够更快地识别具有候选疫苗产品及治疗潜力的抗原。
“新冠疫情发生以来,人们对传染病和疫苗的兴趣越来越大,而且抗菌素耐药程度的加剧会使这一领域的关注度增加,AI则可以帮助开发更新更好的疫苗及免疫疗法。”Evaxion传染病疫苗开发副总裁Pär Comstedt表示。
(相关资料图)
AI技术加速疫苗研发
上述《Using AI to create a vaccine revolution》文章称,日前,基于细菌疾病平台和免疫肿瘤学平台,Evaxion设立“病毒疾病平台”,通过AI手段来筛选及确定一批针对现有的、新出现的及未知的可能变异的病毒下的候选疫苗。具体来看,该平台可以先确定候选疫苗的先导化合物,该化合物同时靶向T细胞和B细胞,且具有强大而持久的免疫应答和细胞反应。
而在《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》论文中,为了高效设计出更稳定、成药性更好的mRNA序列,百度生物计算创设LinearDesign算法,该算法运用自然语言处理中的网格解析技术,对mRNA序列进行优化,从而提升了mRNA序列的稳定性、有效性。
论文还证明,以新冠病毒的Spike蛋白为例,采用传统方法需要在查看10的632次方个mRNA序列后才能寻找一条稳定的mRNA序列,但在LinearDesign算法下这一过程可以在11分钟内完成。
“近年来,AI技术在生命科学领域获得了多项重要进展。”复旦大学管理学院信息管理与商业智能系助理教授李文文在接受第一财经采访时表示,比如,此前业内最重磅的成果之一,是Google深度学习公司在2022年发布了基于AI技术的蛋白质模拟构造公开查询平台,该平台已经模拟了2亿种蛋白质结构,“这一技术在模拟和发现化合物结构上有帮助,或能使包括新冠疫苗在内的药物研发过程提速。”
李文文说称,药物研发过程中,AI技术扮演的角色更多的是一种工具。上述百度生物计算对于mRNA序列的优化,本质上是AI技术在进行序列数据输入下的模型训练,有监督的训练要数据是否带标签且优质,无监督的训练则取决于好的算法模型。
AI参与药物研发遵循哪些逻辑,有何难点?李文文解释,药物本身作为一个化合物,其结构复杂,组合数量有10的40亿次方~60亿次方种,药物研发就是在这海量的组合数量中找到1~2种化合物;因此,其中相设计和发现的过程很重要,可以将筛选范围进一步缩小,“AI技术就可以将这一过程自动化,让模型自动去识别靶点,生成新的分子结构,最终形成可能的化合物。”
“事实上,AI算法的形成需要庞大数据去学习,而在药物研发领域,这些数据包括了蛋白质的相关结构、不同串的氨基酸序列等;而AI技术本质上需要去处理这些数据。”李文文说,目前,AI技术在药物(尤其是新冠疫苗)研发上的难点在于数据获取和积累,实验室的数据昂贵,而药企的数据共享程度不够,以及基础的、带标记的数据稀缺等,这些都是受限制的地方。
为此,李文文建议,若要加速新冠疫苗研发的进程,相关药企也需要在团队中设置一支AI工程师队伍,这些AI人才也同样需要兼具生物医药领域的知识,这是生物医药和人工智能这2门学科的交叉,“目前,在算法上,国内外几乎没有差距,不同点在于对于数据的处理、以及对行业纵深的理解。”
作用与挑战
据AI咨询机构Deep Pharma Intelligence统计,截至2022年12月,全球800家AI制药公司的总投资额达到59.3亿美元,9年间增长了27倍。而今年第一季度,已有超过28笔对AI制药公司的投资,平均投资额为3800万美元。
AI技术在新冠疫苗研发环节,究竟可以发挥哪些作用?尚存哪些挑战?
浩悦资本副总裁、创新医药组联席负责人康子圣表示,比如,可以通过AI来预测新冠病毒某一个局部蛋白的三维结构,其中AI在预测三维结构上的准确性就很重要,这可以使新冠疫苗在设计上更加理性一些。再比如,以mRNA为技术路线的新冠疫苗为例,利用AI技术,不但可以达到优化序列的目的,还可以针对递送载体进行筛选,并提升相关效率。
AI参与的路径上,康子圣解释,某个蛋白质能否作为一个成药的靶点,更多是要先研究它本身的生物学功能,和它在信号通路中所扮演的角色;如果发现抑制或者激动它可以产生很好的治疗疾病的作用机制,那么它才是一个合格的药物靶点。
然后,在发现这个蛋白质它是一个合格的成药物靶点后,就需要设计药物去干预它,在这个阶段,如果尽早地了解它的三维结构,设计药物在接下来才会变得更顺利、更方便。
康子圣还称,算力、算法、数据这三个维度一直是新冠疫苗甚至所有药物研发的关键环节,其中,算法和数据尤其需要突破,“AI技术的介入可以结构预测、序列优化等多个场景发挥作用,但更多的还是要在后续试验中去进行验证。”
事实上,国内AI制药企业已有成功经验。作为全球首款获FDA批准上市的新冠小分子口服药,辉瑞P药在晶型上的开发,正是基于晶泰科技在AI智能预测和实验验证上的能力,这也使得P药整体研发进程缩短了自少6个月至1年时间。
“小分子药物的晶型是否具有优势,在于它应适用于后续的工艺放大和规模化生产,以及在常温存储时结构稳定,AI技术可以帮助实现。”一位病毒学家告诉记者,但现阶段,AI技术在参与广谱新冠疫苗及药物研发上则有一定难度,“一方面,AI生物医药信息平台所需要的数据有限,包括已有的免疫学研究结果有限,已知蛋白靶点的数量有限,这需要行业进行有价值、带标签数据的共享;另一方面,一些由AI模型筛选出的候选药物,其动物试验结果往往与预设结果相距甚远。这些都亟待进一步完善。”