2023年7月17日上午,美国密苏里大学哥伦比亚分校信息学研究所许东教授应太阳成集团tyc122cc邀请,以线下和线上结合的形式在王湘浩楼A521教室为太阳成集团tyc122cc的老师和同学们作了题为“Protein Analysis through Neural Relational Inference of Molecular Dynamics Simulation Trajectories”的学术报告。
讲座开始后,许东教授首先介绍了分子动力学模拟过程,然后介绍了分子之间的混沌现象,由于分子间的非线性效应,所以会有混沌现象;但是即使微观会有一定的混沌现象,但在宏观上来看会涌现出一定的属性;这就提示我们对于非线性动力学系统的分析并不需要关注所有细节,因为它具有一定的鲁棒性。接下来简单介绍了一些传统的动力学分析的方法,比如Principal component analysis和Cross-correlation analysis;但这些方法主要是基于平衡态以及线性模式来做的,但是分子动力学过程通常不处于平衡态并且是非线性的。接下来许东教授介绍了基于Graph的机器学习方法,其中着重介绍了本次报告的主题模型:NRI模型(Neural Relational Inference),它作为一个无监督的模型,在只给出观测时序数据的基础上显式推断图上节点之间的潜在交互结构的同时学习节点的动力学;然后许东教授介绍了他发表在Nature Communications上的一篇基于NRI模型做蛋白质分子动力学分析的相关工作,主要目的是能够帮助分析蛋白质变构的过程。许东教授接着介绍了这篇工作的贡献:有效地生成了蛋白质过程中分子之间的交互图,并且较为准确地重构了分子的动力学轨迹;准确地对分子的自由能分数进行评估;并且发现在推断出的交互途中的蛋白质变构位点和活性位点之间的最短通路可以帮助于调控变构过程的通讯。
许东教授又接着分享了他对于为什么深度学习会能够帮助于分子动力学分析的观点。对于分子动力学这样一个高维的时间序列,通过embedding就能得到一些底层的模式;NRI模型在一定程度上就达到了这样的功能。
最后许东教授分享了分子动力学研究未来工作的重点:提到了设立分子动力学分析的网站服务;用动态图神经网络来推断分子之间的动态交互结构;分子动力学的Foundation model;以及是否能够真正地做到分子动力学地长时间模拟,以助于更好的分析生物学过程。
讲座结束后,许东教授热情地与同学们展开互动,并根据同学和老师们的问题提供了详尽的解答。本次报告收到了广大师生的热烈响应,引发了强烈反响。
许东教授是电气工程与计算机科学系特聘教授,任教于克里斯托弗·邦德生命科学中心和美国密苏里大学哥伦比亚分校信息学研究所。许东老师于2007-2016年担任计算机科学系主任,2017-2020年担任信息技术项目主任。于1995年博士毕业于美国伊利诺伊大学,在美国国家癌症研究所做了两年的博士后工作。在加入密苏里大学之前,许东老师一直是橡树岭国家实验室的科学家。30年来,许东老师在计算生物学和生物信息学的多个领域进行了研究,包括单细胞数据分析、蛋白质结构预测与建模、蛋白质翻译后修饰、蛋白质定位预测、计算系统生物学、生物信息系统和生物信息学在人类、微生物和植物中的应用等。自2012年以来,许东老师的研究重点为生物信息学和深度学习之间的接口。许东老师现已发表了400多篇论文,被引用21,000余次。并于2015年入选美国科学促进会会士,2020年入选美国医学与生物工程研究所会士。