AIxiv专栏是呆板之心宣布学术、技巧内容的栏目。从前数年,呆板之心AIxiv专栏接受报道了2000多篇内容,笼罩寰球各年夜高校与企业的顶级试验室,无效增进了学术交换与传布。假如你有优良的任务想要分享,欢送投稿或许接洽报道。投稿邮箱:[email protected];[email protected] SIGKDD(简称 KDD)始于 1989 年,是寰球数据发掘范畴汗青最长久、范围最年夜的国际顶级学术集会。KDD 2025 将于 2025 年 8 月 3 日在加拿年夜多伦多举行。克日,阿里保险交互内容保险团队与浙江年夜学软件学院周晟教师团队针对多标签分类场景的图神经收集加强技巧的结合研讨结果《Correlation-Aware Graph Convolutional Networks for Multi-Label Node Classification》被 KDD 2025 收录。这也是 NeurIPS 2024 之后,两边配合的第二篇顶会结果。论文地点:https://arxiv.org/pdf/2411.17350图神经收集(GNNs)曾经在图数据发掘的节点分类、链接猜测的义务中都获得了宏大胜利。对节点分类义务,传统图神经收集重要存眷各节点数据单标签种别的场景。而在事实天下中,很多节点属于多个种别,而不是单一种别,如交际收集中的用户多兴致,危险用户每每关系了多个危险域,使得 GNNs 在处置多标签场景时可能会见临新的成绩。在这项任务中,咱们剖析了多标签分类场景对 GNN 自身新闻通报机制带来的潜伏成绩,将其演绎为节点特点跟拓扑构造的含混性,进而提出了 CorGCN 停止处理。详细来讲,CorGCN 起首进修与多标签相干的节点特点并将它们剖析为多个标签感知特点;基于此,进一步剖析出多个标签感知图停止图加强;终极在标签感知图长进行关系加强的图卷积。1. 研讨配景本研讨重点存眷于怎样加强图神经收集在多标签节点分类的才能。在事实天下中,图上的节点更多情形上司于多个种别,而不是单一种别,使得 GNNs 在处置多标签场景时可能会见临着特点跟拓扑构造的含混性成绩,这下降了图数据中信息通报的正确度,并影响了图数据中的标签相干性建模。咱们起首将多标签节点分类场景的特色演绎如下,图 1 给出表示跟 PCG 数据集 [1] 上的剖析试验。图 1:(a)多标签节点分类差别示例;(b)-(c) PCG 数据集上的含混特点跟含混拓扑。(1)含混特点(Ambiguous Feature):在单标签设置中,节点能够经由过程转换特点从邻域节点中聚合特定范例的标签形式。但是,在多标签设置中,与非图数据上的数据特点存在含混成绩相似,一个节点的特点可能与多个标签相干,特点所代表的形式是含混的。因而,从这些含混特点中聚合信息将影响节点表现的辨别才能。图 1-(b) 展现了在事实天下的图中,调配类似特点的节点可能共享差别的标签数目。(2)含混拓扑(Ambiguous Topology):在单标签设置中,衔接的节点平日共享雷同的单一标签(也称为同配性假设 [2]),因而沿边传布的形式平日是断定性的。但是,在多标签设置中,衔接的节点都有多个标签,沿边传布的形式平日是含混的。这种含混性使得咱们难以断定应当从哪些衔接的节点中聚合特定标签的信息。直接从全部街坊那边聚合信息将进一步累积含混性,侵害 GNN 进修到的表现的辨别才能,终极影响特定标签的揣摸。图 1-(c) 展现了在事实天下的图中,衔接的节点可能共享差别的标签数目。因此,在含混特点跟含混拓扑的情形下停止图神经收集的新闻聚合也会存在以下成绩须要处理:标签奇特性(Label Distinctiveness):如前所述,多标签图中的节点属性跟边可能同时遭到多个标签的影响。直接从如许的图中提守信息,混杂节点标签可能招致标签奇特性的损失,招致对每个标签的摸索缺乏。标签相干性(Label Correlation):在多标签设置中,节点与多个标签的关系象征着这些标签之间存在相干性。现有多标签进修方式的胜利也证实了充足应用这些标签间相干性能够明显进步表现的品质。基于此剖析,本文提出了基于标签关系感知图神经收集,从而为 GNN 更好地适配于多标签节点分类场景供给思绪。2. 研讨方式本研讨论文提出了一种名为 Correlation-Aware Graph Convolutional Network(CorGCN)的方式,团体思绪如图 2 所示,包含:关系感知图剖析(Correlation-Aware Graph Decomposition):起首进修与标签相干的节点特点,并将它们剖析为多个标签感知特点。而后,基于剖析后的特点,进一步剖析出多个标签感知图停止图加强。关系加强图卷积(Correlation-Enhanced Graph Convolution):每一层包含在每个标签感知图视图中的邻域内标签新闻通报以及标签感知新闻之间的标签间相干性传布。2.1 关系感知图剖析(Correlation-Aware Graph Decomposition)因为在多标签场景中,图的节点特点跟拓扑构造存在不明白性,咱们的目的是将它们剖析成多个图。但是,直接停止剖析会招致要害的多标签相干性属性的丧失。因而,咱们须要基于曾经包括了标签相干性的表现来停止剖析,因而本阶段存在两个递进的步调:节点特点剖析跟拓扑构造剖析。节点特点剖析(Feature Decomposition):该模块起首建模节点-标签跟标签-标签之间的相干性,而后基于此停止节点特点在差别标签空间的剖析。详细而言,起首对 K 个标签分辨初始化一个可进修标签表征 E^l,而 n 个节点的原始特点界说为 E^x。这两类表征会应用对照进修跟终极的分类丧失停止相干性进修。随后咱们经由过程类似度投影失掉相干性建模后剖析到 K 个标签空间的节点表征,每个节点的剖析后表征为 E_i^proj。拓扑构造剖析(Structure Decomposition):基于关系感知剖析的节点表征,该模块旨在为每个标签及其相干标签剖析图构造(新闻通报门路),以加强新闻传布的图构造。详细而言,应用原始图构造 A^0 在每个标签 k 的表征空间中停止核心节点与邻域信息的融会:随后,基于融会后的标签 k 角度的表征,应用 top-k 类似度结构标签 k 的传布图 G^k,如下所示:别的,联合相干标签感知的节点特点跟原始图拓扑,能够取得多标签感知图 G_0 = (A_0, E_x) 以经由过程新闻通报捕捉相干构造形式,从而终极能够失掉如下的感知相干性的剖析图 CDG:2.2 关系加强图卷积(Correlation-Enhanced Graph Convolution)先前对多标签节点分类的研讨重要停止了同一的邻域新闻通报。咱们以为这种方式有两个重要的范围性:(1)以同一的方法通报来自邻域的含混新闻;(2)相干性疏忽,即在通报新闻时疏忽了标签之间的相干性。因而,咱们进一步为