人工智能如何助力“算”出新药?
创始人
2024-12-18 08:42:27
0

11月9日,参观者在第七届进博会上与家庭陪伴机器人互动。新华社记者 王乙杰 摄

药物研发过程漫长而复杂,“先导化合物的发现”是关键一步。面对化合物多如牛毛、靶点信息有限、作用机制难以明确的困境,人工智能会发挥什么样的作用?

2024浦江创新论坛期间,上海国际计算生物学创新大赛面向业界出题:筛选出对NMDA受体亚型GluN1/GluN3A具有高活性的药物分子。来自上海科技大学的GeminiMol团队开发了一种人工智能模型,该模型通过融合化合物的成药性与构象空间信息以精准表征药物分子性质,从而显著提高药物筛选命中率。凭借这一创新方法,团队筛选出的分子在所有参赛队伍中活性最强,并以总分第一的成绩斩获一等奖。

“尽管人工智能带来的变革刚起步,但它已经显示出巨大潜力。”上海科技大学研究员白芳说,传统的计算生物学依赖物理模型驱动,需要将生物学现象抽象成数学公式,而人工智能的出现改变了这一局面,“即使缺乏精确的物理模型,人工智能依然可以通过‘数据驱动’的方法,将物理或生物现象直接映射到所需的输出结果。这种‘黑箱’特性使人工智能具有极高的应用潜力,但同时也限制了模型的解释性和可控性,因此展现出一种双刃剑的性质。”

从“大海捞针”到“对症下药”

为什么以NMDA受体亚型GluN1/GluN3A为题?记者采访了解到,NMDA受体是神经疾病的热门药物靶点,与脑卒中、抑郁症、癫痫、阿尔茨海默病、疼痛等多种疾病相关。而该受体亚型GluN1/GluN3A尚未被广泛开发,关于其蛋白结构和小分子调节剂的信息非常匮乏。

如果把受体比作门锁,那么药物分子就是打开门锁的钥匙。在不知道锁孔形状的情况下寻找钥匙,非常困难。

大赛的出题人介绍,研究人员以往普遍采用高通量生物实验的方法筛选药物分子,这一过程犹如大海捞针。

计算生物学可以通过模拟和计算加快这一进程。简单来说,计算生物学是利用计算机技术研究生物学的交叉学科,如今深度学习等人工智能技术可通过“干实验”(计算模拟)先从大量化合物中筛选出潜在的药物分子,相当于为生物学“湿实验”(生物实验)大幅缩小了范围。

“药物分子要发挥生物功能,与其自身多变的三维构象和蕴含的药效信息密切相关。我们开发的人工智能模型GeminiMol,通过对比学习的方式将构象空间信息融入分子表征中。与传统分子表征方法相比,这种方式显著提升了模型的表征能力和预测精度。”此次斩获一等奖的GeminiMol团队成员王世航说,团队先调研了一些已知活性分子,然后在大赛主办方提供的分子库中寻找与已知活性分子的三维药效构象高度相似、二维化合物结构不相似的新分子。

王世航表示,团队筛选出来的药物分子,对NMDA受体亚型GluN1/GluN3A的活性为0.98微摩尔,这一指标的含义是发挥出药物的作用需要的剂量,数值越小越好。

筛选药物分子的模型怎样打造

二维结构是生成分子数据的起点,构象空间则进一步反映了分子在自然状态下可能存在的动态形态。如果两个化合物在构象空间上非常相似,它们可能作用于相同的疾病靶标,有相似药效。

GeminiMol团队成员王林介绍,目前的分子相似性评价工具之所以有待提升,是因为其往往只关注分子的二维结构:“就像人们打招呼,握手和握拳的意义完全不一样,不同手势会产生不同效果,药物分子的空间构象也决定了其药效。”

人工智能的学习能力可以将人的经验转化为可靠的模型。王林表示,团队首先花费了大量时间对分子的构象空间进行采样,并投喂给人工智能模型进行学习。此外,团队通过计算分子间的构象空间相似性形成了一系列描述符号,让模型从描述符号数据中学习评价分子相似性的能力。

速度快,是人工智能模型的优点之一。以这次比赛为例,面对1800万个化合物分子,GeminiMol模型仅用不到半个小时就完成了筛选评价。

在筛选过程中,人工智能模型还可以“集百家之长”。“我们可以同时借鉴两三个已知活性较佳的分子,这样得到的新分子可能兼具所有已知活性分子的药效特征或结构信息。”王林说。

GeminiMol团队指导老师、上海科技大学研究员白芳表示,计算生物学经历了几十年的发展,如今迎来了从硬件到算法的显著进步。硬件方面,人工智能芯片、专门为计算生物学设计的高性能计算机提供了计算支持;算法方面,人工智能的第三次浪潮带来了机器学习的飞跃,深度学习等先进算法不仅提高了计算生物学的预测能力,还赋予了它创造新事物的可能性。

人工智能推动药物设计新范式

“人工智能赋能药物设计的空间非常大,未来会发展得更好。”白芳介绍,现阶段的人工智能模型并非全能,其带来的变革刚起步不久,很多药物设计任务中还需要基于物理模型的计算机辅助药物设计方法予以辅助。

生物制药中的问题通常是极其复杂的超高维问题,但当前的生物实验数据在数量上极为有限,质量参差不齐,并且数据之间难以对齐。“面对这些高维数据的挑战,我们往往需要借助物理模型对科学问题进行降维处理,以简化问题并降低数据量的需求。”白芳表示,这是权宜之计,虽然降低了对数据数量的依赖性,但也要付出一些准确性上的代价。

以药物设计的两种路线为例,一种是参考有药效活性的分子设计药效活性更佳的新分子,这正是GeminiMol团队人工智能模型的思路,业界探索广泛且成效初显;另一种则是基于靶标结构来设计与其适配并强结合的分子,人工智能对此虽然有一些尝试,但还不成熟。再如,业界希望让人工智能自动生成高活性的化合物,但生成全新化合物往往并不容易,理想与现实间还存在技术壁垒。

受访者提到,计算生物学的发展表明,单一学科的知识和经验已不足以应对当前的科研挑战。GeminiMol团队成员田思源表示,尽管团队主要负责人工智能工具的开发和应用,但验证环节涉及生物实验,这表明科研人员最好能了解并掌握从上游到下游各个环节的知识。

白芳呼吁,在人才培养方面,尽可能早地进行学科交叉学习和项目实践,“随着人工智能技术不断发展,学科交叉已是大势所趋,这种跨学科的合作和知识融合,将为解决复杂科学问题提供新的视角和方法。”

作者:□董雪 曹嘉阳

来源:经济参考报

相关内容

敦煌市政协召开十届18次常...
8月5日,敦煌市政协召开十届18次常委会议,市政协党组书记、主席乌...
2025-08-07 06:02:31
2025年中秋国庆连休8天...
2025年的中秋节与国庆节罕见连休,从10月1日至10月8日共放假...
2025-08-07 06:01:48
夜色赶海
8月5日晚8时许,青岛石老人海水浴场沙滩上热闹非凡。不少市民趁着晚...
2025-08-07 05:59:20
原创 ...
顺治皇帝的陵墓得以保存至今,确实是多方面因素共同作用的结果,而其中...
2025-08-07 05:34:03
原创 ...
1967年的一天,开国上将许世友将军从北京参加完国庆典礼,如期回到...
2025-08-07 05:33:59
原创 ...
他是国军起义走出的将领,险些被遣散回家,55年成为开国上将 李达上...
2025-08-07 05:33:49
原创 ...
“江山代有才人出,各领风骚数百年。”历史的舞台上,权力更迭如同潮汐...
2025-08-07 05:33:38
原创 ...
晋朝在短暂实现天下大一统后,再次爆发战乱,这一次是整个汉人的浩劫。...
2025-08-07 05:33:32
原创 ...
1900年,八国联军的铁蹄踏破了中国古老的城墙,京城在战火中被掠夺...
2025-08-07 05:33:04

热门资讯

曼联旧将瓦伦西亚遇球迷跳桥轻生... 前厄瓜多尔国家队队长、曼联球星安东尼奥-瓦伦西亚近日在社交媒体上分享了一段深刻且令人动容的经历。他透...
看!南昌这些动物们如何花式“避... 三伏天的热浪席卷而来,南昌动物园为动物们启动了清凉消暑模式。8月4日上午,记者走进南昌动物园,探寻动...
高温津贴如何贴心发放 7月31日,郑州市金柳南路一棚户区改造项目,建筑工人走出工地。本报记者 王向前 摄 7月23日,正...
阿里巴巴联合多所高校突破性研究... 想象一下,你是一位医生,面对一个生病的病人。传统的治疗方式是直接开药,希望药到病除。但是,如果你在开...
马铃薯“身世之谜”如何被解开? 马铃薯是全球第三大主粮作物,它是如何起源的呢?没有人能想到,约900万年前,一场远古的基因“联姻”会...
传统农业如何破局?巴渝农业经理... 当农产品遭遇同质化竞争,如何跳出价格战泥潭?技术创新能否打通堵点? 8月5日,带着这些关乎农业未来的...
现场实拍红军16岁小将恩古莫哈... 现场实拍红军16岁小将恩古莫哈一条龙推射建功
友谊赛-16岁小将一条龙维尔茨... 友谊赛-16岁小将一条龙维尔茨破门 利物浦3-1横滨水手
没看够!利物浦vs横滨比赛结束... 没看够!利物浦vs横滨比赛结束后球迷久久不愿离场
从5台无人车追加到35台无人车... 近日,有媒体探访了浙江余杭瓶窑的一家共配中心。探访后记者表示,“虽然我从2019年开始看过各家公司、...