[图神经网络]图嵌入
创始人
2025-05-31 08:35:26

将节点映射成D维向量主要有以下几种方法:

        ①人工特征工程:节点重要度、集群系数、Graphlet等

        ②图表示学习:通过随机游走构造自监督学习来实现,如DeepWalk,Node2Vec

        ③矩阵分解

        ④深度学习:图神经网络

一、图嵌入

        传统图机器学习需要使用人为的特征工程来实现图到D维向量的转换。而图表示学习是有计算机自动学习特征将各模态输入转换为向量,这个过程不需要人工干预。

         d维向量有如下特点:

                低维:向量的维度远小于节点数

                连续:每个元素都是实数

                稠密:每个元素都不为0(区别于热编码)

        嵌入向量包含网络的连接信息,且能用于下游任务。

二、基本框架

        1.编码器

                输入一个节点,经过处理后输出其对应的d维向量

        2.解码器

                将编码器得到的向量进行点积,得到其余弦相似度(标量,可以反映节点的相似度)

        !!!需注意的是编码器和解码器的结构是可以更换的,不一定是点积,得到的也不一定是余弦相似度。

        框架迭代优化的方向是:使得图中相似节点的向量数量积大,不相似节点的向量数量积小

三、常见的编码器

        1.浅编码器

                实质上是人为将所有节点的d维向量写入一个矩阵Z中,将此矩阵与一个热编码(one-hot)向量v相乘即可得到嵌入向量,记作:Enc(v)=z_v=Z \cdot v;其中矩阵Z的参数为可学习参数。

        2.随机游走

                从u节点出发,生成一个随机游走序列,求其经过v节点的概率,记作:P(v|z_u)

                可以通过softmax激活函数计算:\sigma (z)[i]=\frac{e^{z[i]}}{\sum e^{z[i]}}sigmoid计算:S(x)=\frac{1}{1+e^{-x}}

                ①Deepwalk

                        1.采样得到若干随机游走序列,计算条件概率

                        2.迭代优化每个节点的d维向量,使得序列中共现节点向量数量积大,不共现节点向量数量积小。

        似然目标函数\underset{f}{max}\sum logP(N_R(u)|z_u),其中N_R(u)为从u节点出发的随机游走序列,游走策略为R

        损失函数\iota=\sum\sum -log(P(v|z_u)),其中概率由softmax计算P(v|z_u)=\frac{exp(z_u^Tz_v)}{\sum exp(z_u^Tz_n)}

         负采样:可以将P(v|z_u)=\frac{exp(z_u^Tz_v)}{\sum exp(z_u^Tz_n)},近似为log(\sigma(z_u^Tz_v))-\sum_{i=1}^k log(\sigma(z_u^Tz_{n_i}) ),此式中的 k 为负样本个数。k一般取5-20,且统一个游走序列中的节点不应被采样为“负样本”。

                Node2vec

                        其余步骤和Deepwalk一致,但是可以通过设置超参数来规定随机游走的偏向性:BFS--宽度优先--局部探索;DFS--深度优先--全局探索

相关内容

热门资讯

cad打印线条粗细设置 cad... 004-线型(下)打印样式设置和线型文件使用一、线宽设置方法制图规范里边的线宽要求,我们已经定义好,...
荼蘼什么意思 岁月缱绻葳蕤生香... 感谢作者【辰夕】的原创独家授权分享编辑整理:【多肉植物百科】百科君坐标:云南 曲靖春而至,季节流转,...
长白山自助游攻略 吉林长白山游... 昨天介绍了西坡的景点详细请看链接:一个人的旅行,据说能看到长白山天池全凭运气,您的运气如何?今日介绍...
应用未安装解决办法 平板应用未... ---IT小技术,每天Get一个小技能!一、前言描述苹果IPad2居然不能安装怎么办?与此IPad不...
阿西吧是什么意思 阿西吧相当于... 即使你没有受到过任何外语培训,你也懂四国语言。汉语:你好英语:Shit韩语:阿西吧(아,씨발! )日...