2022年5月27日上午9点30分,太阳成集团tyc122cc第二届“研学论道”研究生学术沙龙第四期(总第十九期)顺利举办。
本期邀请了2019级硕士生苗航和张梦玺进行学术分享。他们分享的主题分别是“推荐系统”和“Github社区信息挖掘”。本次沙龙活动旨在通过学术分享,拓宽研究生学术视野,促进同学之间的科研交流。活动由太阳成集团tyc122cc研究生会干事王子昌主持,以腾讯会议的方式线上举行。
会议上半场,讲者苗航分享了以“元路径和图结构增强的图神经网络社交推荐研究”为题目的论文。讲者首先介绍了文章的背景,随着在线社交信息的蓬勃增长,易于获得的社交信息已经被广泛应用于推荐系统,如何充分利用社交行为学到更精确的用户和物品的表示是社交推荐的核心问题。由于用户在社交网络以及用户-物品交互网络中都扮演着重要的角色,已有的一些研究通过图神经网络建模了两个网络上的信息扩散过程,再经过信息融合来获得高阶的信息。但这种建模方式存在几个问题:未对一些潜在的协作信号进行显式的编码;并且由于链接的不可靠性,一些不可靠的交互也可能引入了噪声导致性能下降。针对上述问题,讲者提出了元路径增强的轻量型图神经网络(ME-LGNN), 在融合后的异质信息网络上通过轻量级的图神经网络进行显式的编码来捕获高阶协作信号。同时,设计了一系列有意义的元路径,通过约束元路径的路径概率来使得模型能够更加关注可靠的链接,进一步增强模型的嵌入表示能力。最后讲者在公用数据集上进行了大量的实验,与几个经典推荐模型进行比较,验证了所提出方法的有效性。
会议下半场,讲者张梦玺带来了以“Github社区信息挖掘”为主题的论文分享。讲者说道,为了规范化用户书写pull request的格式以对代码或文档修复,GitHub社区在2016年提出了Pull Request Template(PRT)的辅助工具,帮助开发人员更好地审查pull request,也帮助贡献者更好地书写pull request。但目前没有关于PRT有效程度的验证,即开发人员与贡献者是否愿意使用PRT。针对上述问题,讲者提出并解决了四个研究问题。第一,目前PRT的应用情况是怎样的,第二,有PRT的仓库之间有什么特点,第三,PRT的存在会对GitHub社区、仓库带来什么影响,第四,为什么只有很少的仓库愿意使用PRT。
汇报结束后,讲者苗航分享了自己的科研经验以及对同学们的建议,指出在科研的初始阶段,可以多方面涉猎,在获取足够信息及知识后,再专精于某一方向,以获取灵感。讲者张梦玺给出了自己写此篇论文的建议,首先在提交suggestion的时候,必须是自己所做的探究工作能够体现出来的建议。其次如果有些其他的发现则需要详细解释。再次需要添加详细的actionable insight,即得到的结论到底对开发人员来说有什么用?开发人员怎么样才能用这个结论去维护仓库。最后,添加必要的future works,这体现了工作是否有用。至此,本期沙龙圆满结束。
由于端午假期原因,原定于本周五上午举办的研究生学术沙龙第五期(总第二十期)时间调整为本周三上午9点30分在腾讯会议举行,欢迎各位同学持续关注。
撰稿:李朋洋
图片:李朋洋