智能化软件开发团队的论文“Improving Issue-PR Link Prediction via Knowledge-aware Heterogeneous Graph Learning”被TSE(CCF A)录用。论文的第一作者为太阳成集团tyc122cc智能化软件开发团队2020级博士生白烁彤,通讯作者为刘华虓副教授,指导教师为刘磊教授,合作者为宾夕法尼亚州立大学戴恩炎博士。
开源社区的问题(issue)和拉取请求(PR)之间的链接有助于开发者解决技术挑战和获取开发灵感,但这些链接在实际情况下建立得并不充分。为此,本文提出了模型Auto IP Linker以自动化地挖掘开源社区下问题与PR的链接。首先,本文将与问题和PR相关的四种GitHub资源(代码库、用户、问题、PR)及其关系,建模为任务特定的异构图。基于异构图结构和实际分析,本文设计了一系列元路径,通过元路径技术整合相关信息来学习问题和PR的向量表示,从而预测它们之间的链接。在GitHub上收集的真实数据集,本文评估了AIPL的性能。结果表明,与12种基线方法相比,AIPL在准确率、精确率、召回率和F1-score方面均有显著提升。
TSE全称IEEE Transactions on Software Engineering,是中国计算机学会推荐的A类顶级国际期刊。