2022年12月11日和12月12日,美国密苏里大学哥伦比亚分校信息学研究所许东教授应太阳成集团tyc122cc邀请,以线上腾讯会议的形式为太阳成集团tyc122cc的老师和同学们作了题为“Deep Graph Models”的学术报告。
讲座开始后,许东教授首先介绍了什么是图,然后介绍了为什么要使用图神经网络。图的编码可以分为浅编码和深编码,首先介绍浅编码。节点间的相似性可以定义为余弦相似度,用原图中两节点的关系和embedding后两节点的余弦相似度的差异作为损失函数,以此来评估embedding的效果。可以使用随机游走来将图中的各个节点串联成一条路径,并将该路径视为一句话,并用NLP方法对其中节点进行编码,如Word2Vec。随机游走方式包括DFS和BFS,并使用一个有偏向性的游走策略以平衡局部和全局信息。
但是浅编码包括一系列问题,如O(V)的参数量,不能为没见过的节点编码,且不能加入节点信息,深编码应运而生。如效仿CNN的GCN,先将图用傅里叶变换转换到谱域再用逆傅里叶变换转换到空域,聚合节点本身和其邻居节点的信息传递到下一层。GraphSAGE与GCN类似,相比于GCN的直接把邻居节点和本身的信息相加,GraphSAGE随机聚合一部分节点的信息并进行聚合(如平均、Pooling或LSTM)。Graph Attention Network可以对于不同的节点设置不同的Attention值,将聚集改为将各个节点特征加权后相加。对于多头注意力机制,则将多个聚集后的结果concat连接后作为最终结果。之后讲解了Graph Bert和Graph Transformer等一系列延伸模型,介绍了边分类、节点分类、图分类、链接预测、异常检测等下游任务的实现方法。
讲座结束后,许东教授热情地与同学们展开互动,并根据同学和老师们的问题提供了详尽的解答。本次报告收到了广大师生的热烈响应,引发了强烈反响。
许东教授是电气工程与计算机科学系特聘教授,任教于克里斯托弗·邦德生命科学中心和美国密苏里大学哥伦比亚分校信息学研究所。许东老师于2007-2016年担任计算机科学系主任,2017-2020年担任信息技术项目主任。于1995年博士毕业于美国伊利诺伊大学,在美国国家癌症研究所做了两年的博士后工作。在加入密苏里大学之前,许东老师一直是橡树岭国家实验室的科学家。30年来,许东老师在计算生物学和生物信息学的多个领域进行了研究,包括单细胞数据分析、蛋白质结构预测与建模、蛋白质翻译后修饰、蛋白质定位预测、计算系统生物学、生物信息系统和生物信息学在人类、微生物和植物中的应用等。自2012年以来,许东老师的研究重点为生物信息学和深度学习之间的接口。许东老师现已发表了400多篇论文,被引用21,000余次。并于2015年入选美国科学促进会研究员,2020年入选美国医学与生物工程研究所研究员。