专栏中心

EEPW首页 > 专栏 > 双下降真实发生，UW教授用统计学解释偏差-方差权衡，LeCun转推

双下降真实发生，UW教授用统计学解释偏差-方差权衡，LeCun转推

发布人：机器之心时间：2020-10-02 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

选自Twitter

作者：Daniela Witten

机器之心编译

偏差—方差之间的权衡判读对机器学习来说是非常重要的。在深度学习研究中，可能会遇到双下降现象，认为这有悖于偏差—方差权衡。本文通过一个统计学的例子，对偏差—方差权衡展开了形象的解读。

8 月初，华盛顿大学统计学与生物统计学教授 Daniela Witten 在推特上发帖介绍了「偏差 - 方差权衡」与「双下降」之间的关系。这个帖子一经发出便收获了很多点赞与转发。

AI 大咖 Yann LeCun 也转发了该贴，他高度称赞了 Daniela Witten 教授对「双下降」现象的解读。LeCun 写道：「这是对双下降现象非常直观的解释。当模型能力『恰好』能够产生零训练误差时，该现象导致测试误差达到峰值。并且，峰值不会出现在多层网络中，因为它们呈现隐式正则化。」

Daniela Witten 教授的解读究竟有哪些独到之处呢？她开篇是这样介绍的：「还记得偏差—方差权衡吗？它意味着模型在中等程度灵活性条件下表现良好。图中可以看到 U 形测试误差曲线。我们试图找到灵活性的『最佳点』（Sweet Spot）」。

独到的偏差 - 方差权衡解读

上文中的 U 型测试误差曲线基于以下公式：

随着灵活性的增加，（平方）偏差减少，方差增加。「sweet spot」需要权衡偏差和方差，即具有中等程度灵活性的模型。

偏差 - 方差权衡不成立吗？

过去的几年中，尤其是在深度学习领域，已经出现双下降现象。当你继续拟合越来越灵活且对训练数据进行插值处理的模型时，测试误差会再次减小！

在深度学习的背景下，这一点似乎尤为突出（不过，正如我们看到的，这种情况在其他地方也会发生）。到底是怎么回事？偏差—方差权衡是否成立？教科书都错了吗？或者是深度学习的魔力？

深度学习的双下降现象，偏差 - 方差权衡成立

在这篇帖子里，Daniela Witten 教授给出了合理的解释。为了理解深度学习的双下降现象，她列举了一个与深度学习无关的简单示例：自然三次样条曲线（natural cubic spline）。

首先介绍一下什么是样条曲线？本质上，这是一种拟合模型 Y=f（X）+epsilon 的方法，f 是非参数的，由非常光滑的分段多项式构成。

为了拟合样条曲线，Daniela 等人创建了一些基函数，然后通过最小二乘法将响应（response）Y 拟合到基函数上。所用基函数的数量与样条曲线的自由度（degrees of freedom, DF）相同。基函数基本形式如下：

假设 n=20（X, Y），并且想用样条曲线 Y = f(X)+ epsilon 估计 f(X)（此处 f(X)= sin(X)）。

首先，Daniela 等人拟合了一个 4DF 的样条曲线。n=20 时的观测值为灰色小圆点，f(x) 为黑色曲线，拟合函数为浅蓝色曲线。

然后拟合了一个 6DF 的样条曲线。

接着尝试拟合 20DF 的样条曲线，这不是一个好主意。因为得到了 n=20 的观测值，所以为了拟合 20DF 的样条曲线，需要用 20 个特征来运行最小二乘法！结果显示在训练集上零误差，但在测试集上误差非常大！这些糟糕的结果也非常符合偏差 - 方差权衡的预测。

虽然在 20DF 的测试结果非常差，但 Daniela 等人还是进行了 n=20，p=36DF 时的最小二乘法拟合。

这时 p>n，解是不唯一的。为了在无穷多个解中进行选择，Daniela 等人选择了「最小」范数拟合：系数平方和最小的那个（使用了大家最喜欢的矩阵分解 SVD，以实现轻松计算）

下图为 n=20，p=36DF 的拟合结果。

欣慰的是，结果并没有预期的那么糟。下图对比了 20DF 和 36DF 的结果，可见 36DF 的结果比 20DF 要好一点。这是什么原因呢？

下图是训练误差和测试误差曲线，两者的变化曲线差别非常大。以虚线为分界线，当 p>n 时，为什么测试误差（暂时）减少？这难道就是偏差 - 方差权衡所指的对立面吗？

Daniela 等人给出了合理的解释：关键在于 20DF，n=p 时，只有一个最小二乘拟合的训练误差为零。这种拟合会出现大量的振荡。

但是当增加 DF，使得 p>n 时，则会出现大量的插值最小二乘拟合。最小范数的最小二乘拟合是这无数多个拟合中振荡最小的，甚至比 p=n 时的拟合更稳定。

所以，选择最小范数最小二乘拟合实际上意味着 36DF 的样条曲线比 20DF 的样条曲线的灵活性差。

现在，如果在拟合样条曲线时使用了脊惩罚（ridge penalty），而不是最小二乘，结果会怎么样呢？这时将不会有插值训练集，也不会看到双下降，而且会得到更好的测试误差（前提是正确的调整参数值！）

总结

所以，这些与深度学习有何关系？当使用（随机）梯度下降法来拟合神经网络时，实际上是在挑选最小范数解！因此，样条曲线示例非常类似于神经网络双下降时发生的情况。

因此双下降是真实发生的，并不是深度学习魔法。通过统计 - ML 和偏差 - 方差权衡可以理解它。一切都不是魔法，只是统计在发挥作用。

原文链接：

https://threadreaderapp.com/thread/1292293102103748609.html

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词：

相关推荐

《EBD2410开发板说明书》第3章：其它资源介绍

《EBD2410开发板说明书》第3章：其它资源介绍...

资源下载英贝德 EBD2410 说明书开发板 2007-03-23

由CW1524组成的推挽式开关稳压电源电路

设计方案 CW1524 组成推挽式开关稳压电源 2009-08-03

据报道，英伟达将在 2025 年采购高达 80 万块 SOCAMM 模块用于 AI 产品

SOCAMM 被称为“下一代 HBM”，正开始在市场上获得关注。根据 ithome 的报道，引用韩国媒体 ETNews 的消息，英伟达预计今年将采购 60 万到 80 万个 SOC...

智能计算英伟达 LPDDR 人工智能 2025-07-17

立讯精密完成重磅收购，加速布局汽车电子赛道

立讯精密近日正式宣布，已完成对德国Leoni AG及其全资子公司Leoni Kabel GmbH（简称“Leoni K”）的股权收购。这一战略性举措将助力立讯精密深化汽车电缆及线束业务布局，进一步增强其全球市场竞争力。此...

汽车电子立讯精密收购汽车电子 2025-07-17

MSP430 指令系统（三）

MSP430 指令系统...

视频 TI MSP430 2010-03-17

在英特尔退出后，RealSense 在 3D 视觉中规划自己的未来

RealSense，以其用于机器人的 3D 深度相机而闻名，现已正式作为一家独立公司运营。RealSense 于上周从英特尔公司分拆出来，获得了英特尔资本和 MediaTek 创新基金的 5000 万美元资金。机器人报告...

机器人 RealSense 机器人机械视觉 2025-07-17

请教target server的问题？

liujunberg 2005-05-05

TI 基于 MSP430 微处理器的电容式触摸按键方案

TI 基于 MSP430 微处理器的电容式触摸按键方案...

视频 TI MSP430 2010-03-17

[求助]各位达人来帮忙了

shmily1280 2005-05-06

330W交流稳压电源电潞

设计方案交流稳压电源电潞 2009-08-03

据报道，英特尔正在为游戏准备性能更强的 Nova Lake-AX 移动芯片

（图片来源：英特尔）一位知名英特尔爆料者向 Tom’s Hardware 确认，英特尔正在准备一款基于 Nova Lake 的移动芯片，旨在与 AMD 的 Strix Halo APU 对抗。Jayk...

消费电子英特尔移动芯片 2025-07-17

最新世界三极管特性代换手册

最新世界三极管特性代换手册...

资源下载三极管特性代换手册 2007-03-23

PCM4222 社区视频

PCM4222 社区视频...

视频 TI PCM4222 2010-03-17

《EBD2410开发板说明书》第2章：开发板硬件介绍

《EBD2410开发板说明书》第2章：开发板硬件介绍...

资源下载英贝德 EBD2410 说明书开发板 2007-03-23

《EBD2410开发板说明书》第1章：功能介绍与声明

《EBD2410开发板说明书》第1章：功能介绍与声明...

资源下载英贝德 EBD2410 说明书 2007-03-23

从「能用」到「易用」，国产移动工作站上演高铁式突围

中国高铁的崛起，是一部写满韧性的史诗。曾经，我们在铁轨上仰望他国的技术壁垒，从引进第一组高速列车的图纸开始，在谈判桌上博弈、在生产线上摸索，把每一个技术参数刻进骨子里。如今，高铁正在编织起城市与城市的经纬，更将中国的技术...

智能计算 C86 2025-07-17

欧洲安全评级出炉：国产电动汽车表现突出

欧洲新车安全评鉴协会（Euro NCAP）本年度的测试结果显示，中国制造的汽车在安全性能上表现突出，国产汽车军团占据领先地位。本次测试覆盖28款车型，其中18款获得了最高的五星安全评级，中国品牌以13席占据绝对主导，包括...

电动汽车吉利特斯拉 2025-07-17

自动延时降压启动稳压电源电路

设计方案自动延时降压启动稳压电源 2009-08-03

[求助] 求：算法程序

longwangre 2005-05-06

OPA369 社区视频

OPA369 社区视频...

视频 TI OPA369 2010-03-17

[求助]ads1.2下载？？

duan_sc 2005-05-06

单芯片Li—xx充电器

设计方案单芯片充电器 2009-08-03

产品级的按键输入系统设计：去抖、识别与状态机实践

在嵌入式产品开发中，按键输入看似简单，但要实现产品级的稳定性和交互体验，需要考虑多个细节：硬件抖动、长按/短按/连击的识别、响应延迟、误触容错等。尤其在一些工业控制或消费电子产品中，按键响应的准确性与用户体验直接相关。本...

嵌入式系统嵌入式开发 2025-07-17

《EBD9200-I开发平台教程》- ADS与JTAG调试

《EBD9200-I开发平台教程》- ADS与JTAG调试...

资源下载英贝德 EBD9200-I 教程开发平台 2007-03-23

TAS5162 社区视频

TAS5162 社区视频...

视频 TI TAS5162 2010-03-17

500W家用交流自动调压器电路

设计方案家用交流自动调压器 2009-08-03

ASML 警告 2026 年增长停滞，地缘政治风险威胁十年发展

根据路透社报道，ASML 今日发布了其 2025 年第二季度的财务业绩。虽然第二季度订单量超出了市场预期，但该公司警告称，2026 年的增长可能将达不到预期。如其新闻稿所述，ASML 指出，虽然人工...

EDA/PCB ASML 光刻机财报 2025-07-17

[求助]求：算法程序

longwangre 2005-05-06

揭秘机器人之树：一种新的分类法来理解机器人的多样性

在慕尼黑工业大学机器人与机器智能研究所（TUM MIRMI）的 AI 机器人安全与性能中心，研究人员 Kübra Karacan、Robin Kirschner 和 Alessandro Melone（从左到右）分析了机...

机器人机器人工业机器人机器人产业分类 2025-07-17

据报道，英伟达的新款消费级桌面电脑芯片将推迟到2026年

据报道，基于 Nvidia 的 GB10 Superchip 处理器的工作站即将发布，但 Nvidia 的消费级 PC 处理器已被推迟到 2026 年，据 SemiAccurate 的报道。据报道，该...

智能计算英伟达 PC处理器 2025-07-17

更多 培训课堂

更多焦点

更多视频

技术专区