"); //-->
基于信息的方法
介绍了预测方法,我们再来看基于信息的方法。
优良的表征应该能将输入中的大量信息保存下来。受此启发,Vincent et al. 在 2010 年提出使用自动编码器来进行表征学习,这意味着隐藏表征应该可以解码到与其输入一样。
但自动编码器资源消耗高,既需要编码,也需要解码,而在图领域,如何解码图仍还是一个有待解决的问题。那么还有其它可以直接衡量表征与输入之间的信息的方法吗?有的,那就是互信息(mutual information)。
给定两个随机变量,互信息的定义是它们的边界属性和关节属性的积之间的 KL 散度,这又可以进一步推导为熵减去条件熵。

互信息为什么可以计算信息关系?我们可以这样看,如果 X 和 Y 互相独立,且 p(X)p(Y)=p(X,Y),则互信息等于 0,这表明 X 和 Y 不相关。这是合理的,因为 X 和 Y 互相独立。如果条件熵为 0,则 X 和 Y 确定是相关的,则互信息输出为最大值。
Hjelm et al. 2019 证明执行自动编码是计算互信息的重建误差的一个下限。

计算互信息是很困难的,近些年方才出现一些可行的方法。这里有三种典型的方法(MINE、JSD MI 和 infoNCE MI),其基本思想是学习一个神经网络来最大化互信息的一个替代函数。详情请参阅各论文。

回到图,我们能否使用互信息来实现图的自监督学习?DGI 是这方面首个研究成果,其目标设定为最大化输入的节点特征 X 和邻接矩阵 A 与输出表征 h_i 之间的互信息。DGI 使用了 JSD 估计器,其中包含正例项和负例项。

但直接计算互信息的难度不小,我们可能需要另一个 GNN 作为互信息的替代。DGI 使用了表征的读出 s 来替代输入。如下图所示,原图有两个输入,其中错误的图是负例,然后我们用同样的 GNN 得到它们的输出,之后再执行读出函数得到 s。s 可以替代原目标中的 X,A,得到替代目标函数。

DGI 证明这种操作不会导致信息损失,其还证明这种替换方式实际上就等同于真正的互信息。
不过 DGI 仍还有一些问题。第一是它需要读出函数来计算互信息,而且这个读出函数需要是单射式的,这并不容易保证。另外它还需要构建错误的图来得到负例,因此效率不高。而在实验中,DGI 需要为不同的任务使用不同的编码器,这并不实用。
针对这些问题,清华大学、西安交通大学与腾讯 AI Lab合作提出了 GMI,其基本思想是不使用读出函数和错误样本,而是直接计算互信息。
在 GMI 中,首先分两部分定义互信息。一是特征互信息,仅度量节点特征和表征之间的信息关系。二是拓扑互信息,这是预测的边和原始邻接矩阵之间的互信息。

很显然,这一方法能同时考虑到边和特征,而无需读出函数或错误样本。更重要的是,特征互信息还能进一步分解。
我们证明:特征互信息可以分解为局部互信息的加权和。而每个局部互信息计算的是每个节点及其表征之间的互信息。权重取决于不同的情况,将它们设置为与预测的边一样也不错。然后我们可以使用 JSD 互信息估计器来计算特征互信息和边互信息。

在节点分类任务上的实验结果证明 GMI 有更优的表现,相关的代码也已经发布:https://github.com/zpeng27/GMI
至于用于图分类的基于信息的方法,可参看 ICLR 2020 论文《InfoGraph: Unsupervised and Semi-supervised Graph-Level Representation Learning via Mutual Information Maximization》,这里不再过多赘述。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
Arm Flexible Access方案引入Armv9计算平台
基于MC33993与AT89C2051的多路红外遥控系统的电路设计
Arm力推面向汽车的小芯片标准
北斗天通+电子地图技术加持 大理州筑牢文旅户外保障体系
合利科技推出国内最MINI的网络计算机(工作站)、网络终端NC机箱、电源
开关电源基础介绍之 DC/DC 变换器
求助vxworks的裁减
锂电池的充电特点和 TI 最新充电管理技术
巴斯夫与中国石化达成化工产品碳足迹核算方法学互认
基于MAX1666的Li+电池保护电路
时钟解决方案 CDCM6100x
CW200构成的跟踪式集成稳压电源
中汽创智重磅亮相SAECCE 2025,行业首发“人-车-路-云-星”全维信息技术平台联合创新体
基于intel80c196的通用伺服控制系统
用CW200组成的可调恒流源
基于MPC8260处理器的PPMC系统
基于LonWorks技术的智能家庭控制系统
南芯科技推出工业级10uA超低静态电流降压转换器系列产品
FD-SOI:用于安全汽车电子的网络弹性基板
CW200组成的逻辑控制的集成稳压电源
求助
[求助]XP环境下t2.2编译的问题
请教高手一个简单问题
模拟器件 - 时 钟: EMI 降低
BG602组成的逻辑控制的集成稳压电源
研华PCIe Gen5 x4 SSD EDSFF数据中心解决方案
用BG602组成的可调恒流源
可编程,低成本音频 DSP TAS3K系列
利用基于氮化镓的解决方案为下一代 800 伏直流 AI 数据中心提供动力
英飞凌扩展其CoolSiC™产品系列,推出专为高功率与计算密集型应用而设计的400V和440V MOSFET