数学科学研究所
Insitute of Mathematical Science

Applied Mathematical Seminar 47: 多模态蛋白表征学习及药物发现应用

Seminar| Institute of Mathematical Sciences

Time: FridayNovember 24th, 2023 , 16:30-17:30
Location线上,腾讯会议:677-371-797

Speaker: 殷鹏, 中科院深圳先进技术研究院


Abstract蛋白质是生命的物质基础,是构成细胞的最基本的有机物,担当着生命活动承担者的角色。针对蛋白质的量化计算和表征学习,简单来说,就是通过计算机算法将蛋白质的复杂信息转化为一种可以被计算机理解和处理的形式,如向量、矩阵等。我们再利用人工智能的强大计算和拟合能力来研究和理解蛋白质的复杂性,以及预测蛋白属性和生物功能,以及预测特定蛋白靶点的结合药物等。面对蛋白-药物靶点发现预测问题,我们利用深度学习算法将蛋白和小分子药物进行表征学习,并针对数据集偏差、异构性、多模态等分布属性对预测算法不断更新迭代,比如将蛋白质的序列、结构和功能进行有效融合,以掌握更丰富的多模态表征信息,在不同预训练任务上进行优化学习,提升不同下游任务的预测准确性。本报告主要描述近几年课题组在蛋白表征及药物预测领域遇到的一些数据建模问题和相关应用算法的工作。


地址:上海市浦东新区华夏中路393号
邮编:201210
上海市徐汇区岳阳路319号8号楼
200031(岳阳路校区)