科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
软件学院学生在数据挖掘顶级会议KDD 2022上发表两篇论文
文:软件学院 图:软件学院 来源:软件学院 时间:2022-06-01 10754

  近日,第28届ACM知识发现与数据挖掘会议(KDD 2022)官方发布论文录用结果,我校信息与软件工程学院硕士生和本科生为第一作者的两篇论文被大会接收,周帆副教授为论文指导教师和通讯作者,信息与软件工程学院为第一作者单位和通讯单位。

F2D82E00149C21707EE592D6EAC_CE6302D5_71C

图1 SPGCL损失函数示意图

  2020级硕士生黎嵘繁和2019级本科生蒋新科为共同第一作者的论文“Mining Spatio-Temporal Relations via Self-Paced Graph Contrastive Learning”被Research Track接收。

  该研究提出了一种新的时空图数据学习方法SPGCL,解决了现存时空图预测模型中的邻接关系不完善问题(如图1所示),证明了节点和其邻居的全局最优和迭代的局部最优等价,并且利用对比学习和正例-无标签学习提出了自适应的构图方法,能为不同的节点寻找相适应的互信息最大化的邻居集合,同时使得预测损失最小化。相比较以往相关研究,该研究的优势在于一是能动态地构建网络而不是基于静态的超参数;二是为通过互信息建立优化目标函数提供理论依据;三是不依赖某个特定的特征和预处理,而是通过对比学习强化嵌入表示。该研究可作为通用算法应用于时空属性预测任务,在公开数据集上进行的大量实验,证明了与之前最先进的基线方法相比该方案的优越性。

AB2B902FB3890929C4B0F054873_A6D45B78_589

图2 GraphGeo框架图示

  2020级硕士研究生王志远和2019级本科生曾文轩以共同第一作者身份发表的论文“Connecting the Hosts: Street-Level IP Geolocation with Graph Neural Networks”被Applied Data Science Track接收。

  该研究专注于街道级IP地址定位问题,即将给定的任意IP地址识别为其所在的地理位置标识。此前,该问题主要通过测量路由时延等拓扑信息,或整合IP相关数据库的特征实现。然而传统方法存在信息局限性问题,忽略了IP地址与地标之间的关系。该研究通过引入图神经网络来克服这一局限性,并提出了系统性的IP街道级定位框架GraphGeo(如图1所示)。该框架首先以公共路由器为中心,构建目标IP与地标之间的结构关系,并通过空间距离和特征相似度进行赋权。随后通过图神经网络融合IP地址的特征和邻域关系,提取区域公共知识和拓扑。此外,针对网络环境的不稳定性,该方法进行了概率性建模,使得图结构学习和IP定位结果更具鲁棒性。

  KDD为数据挖掘领域的顶级会议,中国计算机学会(CCF)评级为A类会议。KDD包含两个Track,其中 Applied Data Science Track面向工业、互联网和商业等实际数据科学应用场景,Research Track则聚焦于数据挖掘理论、技术和算法的创新性研究,本届KDD两个Track的录用率分别为25%和15%。


编辑:赵海玲  / 审核:林坤  / 发布:陈伟