冰鉴科技斩获全球AI药物研发算法大赛三等奖

近日,首届全球AI药物研发算法大赛总决赛在清华大学举行。经过与来自全球高校、科研机构、企业的878支队伍的激烈角逐,冰鉴科技-南京大学联合团队脱颖而出,斩获三等奖。

首届全球AI药物研发算法大赛由百度飞桨、清华大学药学院和临港实验室共同发起,并得到中国药学会等单位大力支持,同时邀请到多位生物制药领域专家教授担任专家委员会委员。

大赛共吸引了来自全球878支团队的1105人报名参赛,参赛团队共提交了6080次算法成果。冰鉴科技联合南京大学组队参赛,经过历时3个月战况激烈的初赛、复赛,与来自微软亚洲研究院、中国科学院上海药物研究所、上海交通大学、浙江大学、西安交通大学14支优秀的队伍进行总决赛的较量。通过现场答辩,就赛题思路、核心理论、数据分析及处理、算法方案等问题展开深入探讨,冰鉴科技-南京大学联合团队最终以答辩分数第五、综合排名第六的成绩斩获三等奖。

本次大赛聚焦于新冠小分子药物等热点议题,旨在鼓励参赛者利用人工智能方法,发掘治疗新冠病毒的潜在药物。 参赛者可以利用深度学习、分子对接等方法,预测和评估小分子与主蛋白酶之间的相互作用,以及小分子在细胞中抑制病毒复制的潜力,挖掘潜在的药物候选物。以期通过本次大赛,推动药物研发领域的创新,为未来的疾病治疗和防控工作提供有力的支持。

本次的参赛团队由冰鉴科技和南京大学Christopher J. Butch课题组共同组成,包括冰鉴科技的智能决策部和模型开发部的成员,以及南京大学Chris教授团队。在初赛中,团队尝试了Bayes Ridge, SVM, LightGBM, GBDT等多种传统机器学习算法和Transformer-CNN、GCN、D-MPNN等深度神经网络模型,并尝试使用分子的3D构象信息、graph特征、摩根分子指纹等多种分子表征方法对分子的酶活性进行预测。其中,SVM模型和摩根分子指纹的训练方法在预测酶实验活性中发挥了良好效果。

复赛任务是更为复杂的分子在Caco2细胞实验中的活性预测。面对这一挑战,冰鉴科技-南京大学团队采用特征融合的方法,对GEM基线模型进行了创新性的修改,并加入新的MFP encoder结构,将关注分子全局结构和形状的graph特征与关注分子内部局部结构信息的摩根分子指纹结合在一起。这为模型提供了更全面的分子信息,提升了模型对分子活性的预测分类能力,也降低了过拟合的风险,提升了模型的泛化能力。同时,团队还引入了Drop out机制,并使用分子的scaffold作为依据来划分训练集和验证集,以更真实地评估模型在面对新分子时的预测性能。

自2022年3月开始,冰鉴科技与南京大学强强联合,共同探索AI+医药领域的前沿技术与应用,致力于计算机辅助药物分子设计方法和应用研究,使用人工智能、分子动力学模拟、计算生物学等技术与化学/生物学实验室的有机结合来加速药物分子的发现

仅一年时间,双方的合作就取得了显著的成果。除了在大赛中获得奖项之外,本月合作团队还发表了一篇重要的SCI论文《Improving drug discovery with a hybrid deep generative model using reinforcement learning trained on a Bayesian docking approximation》,介绍新的药物发现方法——该方法结合深度生成模型和强化学习,通过使用贝叶斯回归模型预测的近似对接分数来训练,生成的新化合物在对接分数上比相似大小的分子提高了10-20%,同时比仅使用对接的方法快了130倍,可以有效地用于发现具有潜在治疗应用的新化学分子形态。

 

 

相关链接:https://mp.weixin.qq.com/s/RLB0SmxCdHzNPQK3xLuVfw