[发明专利]基于语义信息的多通道图池化方法在审

申请号：	202310070258.8	申请日：	2023-02-07
公开（公告）号：	CN115965805A	公开（公告）日：	2023-04-14
发明（设计）人：	孙志刚;曾佳悦;李先贤;王利娥	申请（专利权）人：	广西师范大学
主分类号：	G06V10/762	分类号：	G06V10/762;G06V10/778;G06V10/82;G06V20/70;G06V10/764;G06N3/042;G06N3/047;G06N3/0464;G06N3/08
代理公司：	桂林市华杰专利商标事务所有限责任公司 45112	代理人：	周雯
地址：	541004 广西壮***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于语义信息通道图池化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于语义信息的多通道图池化方法，其特征在于，包括如下步骤：

1)图数据预处理阶段：

1.1)构造语料库集合：

利用WL子树模式迭代，提取图中不同高度的子树模式构造语料库集合CS；

对图数据集G中所有图进行WL子树模式迭代，通过迭代地聚合每个节点的邻居特征来增强中心节点特征，从而提取到以图中节点为根的不同高度的子树模式，其中第i次迭代得到i阶子树模式，即高度为i的子树模式，构成语料库C_i＝(Ω_i，R_i)，其中Ω_i为包含G中所有不同的i阶子树模式的词汇表，R_i为由G中每个图的i阶子树模式序列组成的集合；相应的，在构造语料库时考虑图中不同高度的子树模式，则为图数据集G构造一个语料库集合CS＝{C_i|i＝1，2，3，...}；

1.2)学习节点多尺度特征向量：

使用Doc2Vec模型分别训练CS中的每个语料库，得到图中节点的多尺度特征向量；

将C_i中的每个子树模式作为一个单词，利用Doc2Vec模型对C_i进行训练，从而得到i阶子树模式的向量表示，将以图中节点为根的不同高度子树模式的向量表示进行拼接得到节点的多尺度特征向量；对于包含n个节点的图g∈G，将n个节点的多尺度特征向量按行排列组成g的多尺度特征矩阵M；

2)GCN卷积阶段：

2.1)利用步骤1.2)中图g的多尺度特征矩阵M和邻接矩阵A，采用GCN模型进行卷积操作，利用图中拓扑结构和节点特征迭代学习节点的特征向量，具体公式定义如下：

其中表示添加了自循环的邻接矩阵，表示的对角度矩阵，W^(l)是GCN中第l层的权重矩阵，σ()是非线性激活函数，初始化X⁽⁰⁾＝M，将最后一层的特征向量作为更新后的特征矩阵X，用于后续任务输入；

3)多通道图池化阶段：

利用图池化操作提高图神经网络的泛化能力；

图中节点具有不同方面的特征和角色，为了弥补单通道池化丢失的节点信息、区分易混淆的结构信息，提出一种多通道的图池化模块MCP：首先，设计三个通道分别独立的从不同的角度进行图池化；然后，执行跨通道卷积操作，融合不同通道的池化图；最后，对池化结果进行汇总，得到经本层MCP模块池化后的图特征矩阵和邻接矩阵；

3.1)多通道池化：

采用三个独立的通道分别对图进行池化，从不同的角度捕获图的特征；

给定图g(X，A)，通道一基于节点选择的池化方法捕获图的局部拓扑信息，通道二基于节点聚类的池化方法捕获图的全局拓扑信息，通道三基于节点选择的池化方法捕获节点的语义信息，具体通道设置如下：

3.1.1)通道一考虑局部拓扑结构：采用特征向量中心性作为节点重要性的衡量指标，该指标综合考虑了节点本身重要性和邻居节点重要性，若一个节点所连接的节点中心性值越高，则该节点的中心性值就越高，选择特征向量中心性最高的前k个节点并返回所选节点对应的索引集Idx₁，最终生成由所选节点对应的生成子图构成的细粒度池化图FP₁；

3.1.2)通道二考虑全局拓扑结构：参考DiffPool节点聚类池化方法，将节点逐层聚类成簇，每个簇作为粗化图中的一个节点，其中簇分配矩阵生成器定义为S＝softmax(GNN_pool(A，X))，表示图中每个节点分配到不同簇中的概率；同时，利用另外一个GNN学习图的特征矩阵Z＝GNN_embed(A，X)，根据分配矩阵S和特征矩阵Z，生成粗粒度的池化图CP；

3.1.3)通道三考虑节点语义信息：首先使用readout()函数获取当前图的整体表示F，然后对F进行非线性变换，得到最后通过内积得到节点v_i的重要性得分其中X[i]为节点v_i的特征向量；选择前k个重要节点并返回这些节点在图中的索引集Idx₂，最终生成由所选节点对应的生成子图构成的细粒度池化图FP₂；

3.2)跨通道卷积：

使用跨通道卷积操作融合步骤3.1)得到的三个池化图FP₁、CP、FP₂；

3.2.1)融合通道一和通道二：首先利用通道二的分配矩阵S和通道一所选择的节点索引集Idx₁计算跨通道关联矩阵A_fuse1，其中A_fus[j]＝S[Idx₁[j]]，0≤j＜|Idx₁|，表示A_fuse1的第j行为通道一中节点j与通道二中每个簇之间的关联程度，然后进行跨通道卷积以增强通道一的特征矩阵，卷积过程为：X_fp1＝σ([X_fp1+A_fuse·X_cp]·W)，其中X_fp和X_cp分别表示池化图FP₁和CP的特征矩阵，W是可学习的参数矩阵；

3.2.2)融合通道二和通道三：首先利用通道二的分配矩阵S和通道三所选择的节点索引集Idx₂计算跨通道关联矩阵A_fus，其中A_fuse2[j]＝S[Idx₂[j]]，0≤\＜|Idx₂|，表示A_fuse2的第\行为通道三中节点\与通道二中每个簇之间的关联程度，然后进行跨通道卷积以增强通道三的特征矩阵，卷积过程如下：X_fp2＝σ([X_fp2+A_fuse2·X_cp]·W)，其中X_fp2和X_cp分别表示池化图FP₂和CP的特征矩阵，W是可学习的参数矩阵；