专栏中心

EEPW首页 > 专栏 > 腾讯AI Lab联合清华、港中文，万字解读图深度学习历史、最新进展与应用（3）

腾讯AI Lab联合清华、港中文，万字解读图深度学习历史、最新进展与应用（3）

发布人：腾讯AI实验室时间：2020-09-28 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

过平滑

首先来看过平滑。GNN 本质上是逐层推送彼此相邻节点混合的表征，因此极端地看，如果层数无限多，那么所有节点的表征都将收敛到一个驻点，这也就与输入特征完全无关了，并会导致梯度消失问题。因此，过平滑的一个现象是模型的训练损失和验证损失都难以下降。那么，为什么会出现过平滑呢？

我们以线性 GCN 来进行说明。首先，GCN 与平滑有何关联？一般来说，GCN 可被视为拉普拉斯平滑（Laplacian smoothing）的一种特殊形式，如下所示：

这个过程意味着一个节点的新特征是根据其本身和相邻节点的加权平均而构建的。

要知道这个过平滑过程发生的位置，我们先讨论一下 GCN 何时会因过平滑而失效？我们将讨论三种过平滑的情况。第一种是使用线性激活时，隐变量 H_L 会收敛到一个特定的点。第二种是使用 ReLU 激活时，H_L 会收敛到一个特定的平面 M。第三种是使用 ReLU 加偏差时，H_L 会收敛到一个特定的子立方体 O(M, r) 的表面。

在使用线性激活的情况下，H_L 为什么会收敛到一个特定的点呢？实际上，这与 L步随机游走有关。一个游走器从一个节点游走到其一个相邻节点的概率为「1/该节点的度」。经过 L步游走后，游走的路径会形成一个已访问节点的序列。用数学公式表示，随机游走的过程实际上就是一个归一化的矩阵的 L次幂乘以初始概率。

然后，如果我们用一组在节点特征上的可学习参数替换这个初始概率，它就能转换成一个线性的 L层 GCN。

可以看出，基于随机游走的一些结论也适用于线性 GCN，其中一项便是随机游走在经过无限多步之后会收敛到一个驻点。

详细地说，我们首先需要进行特征值分解，即将归一化的邻接矩阵分解为 n 个特征值 λ 及其对应的特征向量 u。

将这个求和展开，可得到下式：

这个图谱中的特征值有一个性质。即，假设一个图 g 包含 m 个互相连接的分量，则归一化邻接矩阵的特征值便由 m 个为 1 的最大特征值构成，其余的 λ 则在 (-1,1) 的开区间中。

因此，当 lL趋近无穷大时，最大的 m 项依然存在，因为其 λ 等于 1。但是，其余的项都将被忽略，因为这些 λ 的 l 次幂将趋近于零。这会使得隐变量 H_L 随网络深度增长而趋近于一个特定的点。

另一方面，对于非线性的情况，H_L 将收敛到一个具有非线性激活 ReLU 的特定子空间 M。首先我们给出 M 子空间的定义：

则随着层的深度增加，隐变量将越来越接近子空间 M。H_L+1 离该子空间的距离至少为：

要注意，λ_m+1 是邻接矩阵中最大的非 1 特征值，s_l 则是模型参数 W_l 中最大的奇异值。

接下来我们开始解析这个收敛公式。这个归一化邻接矩阵的收敛满足这一不等式。

如果我们假设这个子空间的维度为 m，则 m 个最大的 λ 将位于该子空间，其余的则在 λ_m+1 的范围内。

然后，模型参数 W_l 和 ReLU 的收敛分别满足下列两个不等式：

有关这些不等式的更详细证明，请参阅 ICLR 2020 论文《Graph Neural Networks Exponentially Loss Expressive Power for Node Classification》。

综合这些不等式，可得到隐变量的子空间距离沿层数变化的收敛性。可以看到，随着层数趋近于无穷大，子空间距离将趋近于 0，因此隐变量将会收敛到子空间 M。

接下来是更一般的情况，使用 ReLU 加偏差的 GCN 又如何呢？H_L 将收敛到一个特定子立方体 O(M,r) 的表面上。首先，我们写出带偏差的 GCN 的公式：

很显然，由于 b_l 到子空间的距离是一个常量，因此其收敛性就满足：

可以看到，当 l 趋近无穷大时，不等式右侧部分就是一个无穷等比序列的和：

因此，可以看到 H_L 将趋近于一个子立方体的表面，其与子空间 M 的距离为 r，而 r 就等于上式。

总结一下，通过分析上面三种来自不同场景的情况，可以发现这三种情况之下存在一种普适的公式。我们可用以下不等式统一过平滑的情况：

然后通过不同的 v 和 r 取值，我们可以得到不同的具体情况：

详见论文：

《Tackling Over-Smoothing for General Graph Convolutional Networks》（https://arxiv.org/pdf/2008.09864.pdf）。

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词：

相关推荐

555交通路口红绿灯自动控制器电路(二)

设计方案交通路口红绿灯自动控制器 2009-07-06

HD7279A在单片机控制系统中的应用

HD7279A在单片机控制系统中的应用...

资源下载单片机 HD7279A 智能显示控制系统指令系统键盘矩阵 2007-02-16

中国Agibot计划在塞尔维亚生产类人机器人

William Shi 在贝尔格莱德举办的产品演示活动后透露，Agibot 将与战略合作伙伴、香港上市汽车零部件企业 Minth Holdings Limited 携手，先期在塞尔维亚生产 1000 至 2000 台人形...

机器人 Agibot 人形机器人 2026-02-04

莫悲观，车企迎来盈利增长转折点

25年底，受累于补贴退出、购置税减免退坡，本土车市订单疲软得让人发慌。放眼2026年，电池、内存、铜铝涨价，车企们成本压力山大，哪怕最乐观的估计，也只不过是预测全年销量可以同比增长一两个百分点。如果只有增长才能解决发展中...

汽车电子车企盈利 2026-02-04

LimX筹集2亿美元用于构建具身智能

中国人工智能自主人形机器人企业 LimX Dynamics Inc. 今日宣布完成约 2 亿美元早期融资，此次融资将用于推进机器人具身智能技术的研发与落地。该轮 B 轮融资的机构投资方包括阿联酋 Stone Ventur...

机器人 LimX Oli 人形机器人具身智能 2026-02-04

爱因斯坦的世界观

liujt_ic 2003-06-18

FPGA典型应用领域及解决方案

本专题主要对当今主流FPGA的应用领域：原型验证与结构化ASIC、数字信号处理、嵌入式处理、物理层通信及可重构计算技术进行分析，并介绍主流FPGA厂商的相关解决方案。...

视频嵌入式 FPGA ASIC 3SL340 2009-10-22

英特尔重返 DRAM 赛道？深入解析与软银合作的 Z-Angle 内存项目

2 月 2 日，英特尔宣布与软银子公司 SAIMEMORY 达成合作，共同研发 Z-Angle 内存（ZAM），其内存领域的野心再度引发关注。根据双方发布的新闻稿，该项目将于 2026 年第一季度启动，预计 2027 年...

网络与存储英特尔 DRAM 软银 Z-Angle 内存项目 2026-02-04

555城建路障用闪光保安灯电路

设计方案城建路障闪光保安 2009-07-06

555实用汽车电子点火器电路

设计方案实用汽车电子点火器 2009-07-06

机器人技术将颠覆人工智能基础设施：未来之路何在

物理人工智能（Physical AI）与机器人技术正从实验室走向现实世界 —— 决策失误的代价不再是理论层面的空谈。随着机器人在工厂、仓库及公共场景的广泛部署，大规模仿真已与现实操作紧密相连。专注于物理人工智能的企业需要...

机器人机器人人工智能基础设施物理人工智能 Nebius 2026-02-04

嵌入式Linux防火墙产品设计下

1、Linux Netfilter/IPtables 概述；2、计算机网络防火墙概述；3、Linux Netfilter/IPtables使用实例；4、Linux Netfilter/IPtables实现框架。...

视频嵌入式 Linux 防火墙 IPtables 2009-10-23

TACC借助 Horizon 系统探索高性能计算混合精度与 FP64 仿真技术

如果想在高性能计算（HPC）仿真与建模领域测试某个想法，并观察其对各类科学应用的影响，得克萨斯大学奥斯汀分校的得克萨斯高级计算中心（TACC）或许是最佳选择。这里是美国国家科学基金会（NSF）旗舰级超级计算机的部署地，因...

智能计算 TACC Horizon 高性能计算混合精度 FP64 仿真技术 HPC 2026-02-04

Gartner再度预测人工智能支出趋势

市场研究机构Gartner已将其人工智能支出预测周期延长至 2027 年，并剔除了已过去一年多的 2024 年数据。与 2025 年 9 月那份我们曾报道过的详尽预测不同，此次高德纳选择减少数据的细分程度 —— 正如你所...

智能计算 Gartner 人工智能支出 2026-02-04

HT单片机选型指南

HT46R/47R/48R/49R 系列OTP 单片机选型指南 ...

资源下载单片机 HT单片机选型指南 OTP 2007-02-16

行动与速度是致胜的关键

liujt_ic 2003-06-18

Holtek 抗雜訊對策

...

资源下载 2007-02-16

FPGA的DSP应用

本专题首先介绍FPGA中的内嵌DSP模块的结构，在此基础上介绍FPGA用于DSP领域一些设计流程和工具。最后介绍FPGA在DSP领域的一些典型应用。...

视频嵌入式 FPGA DSP 2009-10-22

555触模式脚踏车“请让路”语言铃电路

设计方案模式脚踏车请让路语言 2009-07-06

瑞士如何以 “精耕细作” 打造全球半导体优势

近年来，全球半导体与人工智能（AI）领域的竞争一直以 “规模” 为核心驱动力 —— 从建设更大规模的数据中心、开发更庞大且功能更强的模型，到研发日益复杂、功耗极高的芯片，皆体现了这一趋势。据斯坦福大学数据，仅 2024 ...

EDA/PCB 瑞士半导体 2026-02-04

“漏音”6G芯片技术击败了狭窄的太赫兹束限制

第六代移动通信网络（6G）有望借助太赫兹频段实现每秒太比特级的传输速率。然而，要利用太赫兹频谱，通常需要复杂的器件设计来建立多条高速连接。如今有研究表明，先进的拓扑材料或能最终实现这类高速连接。研究人员研制的这款实验性器...

手机与无线通信光子学太比特太赫兹拓扑学拓扑绝缘体 2026-02-04

555汽车低成本直流灯调光器电路

设计方案汽车低成本直流调光 2009-07-06

HD7279A在单片机键盘和显示接口中的应用

HD7279A在单片机键盘和显示接口中的应用...

资源下载单片机 HD7279A 串行键盘 2007-02-16

人性的角逐

liujt_ic 2003-06-18

嵌入式Linux防火墙产品设计中

1、Linux Netfilter/IPtables 概述；2、计算机网络防火墙概述；3、Linux Netfilter/IPtables使用实例；4、Linux Netfilter/IPtables实现框架。...

视频嵌入式 Linux 防火墙 IPtables 2009-10-23

C6000 DSP软件开发环境CCS介绍

CCS在实时调试方面有其重要的特点：基于TI RTDX技术，开发可以借助CCS完成复杂的实时软件调试。CCS还集成了DSP/BIOS 实时操作系统内核，为开发者提供了一个易用的实时软件设计框架。...

视频嵌入式 DSP CCS C6000 2009-10-22

Atlas展示了深层科技如何存活下来

今年全球人工智能机器人热潮中，人形机器人 Atlas 无疑是最耀眼的明星。而其背后的美国机器人企业波士顿动力，自 1992 年成立以来从未实现过持续盈利，此前还多次陷入资本减值困境。即便 2021 年现代汽车集团以约 1...

机器人波士顿动力 Atlas DARPA 2026-02-04

青年成才十大心理障碍

liujt_ic 2003-06-18

HT48MCU的WDT使用

本文以 HT48R10A-1 为例，介绍 HT48RXA-1 系列中 WDT 的使用方法及其注意事项。...

资源下载单片机 HT48 系列 WDT HT48R10A-1 2007-02-16

引喻的力量

liujt_ic 2003-06-18

更多 培训课堂

更多焦点

更多视频

技术专区