专栏中心

EEPW首页 > 专栏 > Softmax 函数和它的误解

Softmax 函数和它的误解

发布人:数据派THU 时间:2023-06-20 来源:工程师 发布文章

:深度学习爱好者 CV技术指南

[ 导读 ]Softmax是个大家都熟悉的激活函数,然而,很多人只知道它的表达式,它在网络中的位置,而对一些具体的原因和细节却回答不上来。这篇文章给了相应的介绍。 

Softmax 是一个数学函数,用于对 0 和 1 之间的值进行归一化。
在本文中,您将了解:

  • 什么是 Softmax 激活函数及其数学表达式?
  • 它是如何使用 argmax() 函数实现的?
  • 为什么 Softmax 只用在神经网络的最后一层?
  • 对 Softmax 的误解

什么是 Softmax 激活函数及其数学表达式?


在深度学习中,使用 Softmax 作为激活函数,对 0 到 1 之间的向量中每个值的输出和尺度进行归一化。Softmax 用于分类任务。在网络的最后一层,会生成一个 N 维向量,分类任务中的每个类对应一个向量。
图片网络输出层中的 N 维向量
Softmax 用于对 0 和 1 之间的那些加权和值进行归一化,并且它们的和等于 1,这就是为什么大多数人认为这些值是类的概率,但这是一种误解,我们将在本文中讨论它。
实现 Softmax 函数的公式:
图片
使用这个数学表达式,我们计算每类数据的归一化值。这里 θ(i) 是我们从展平层得到的输入。
计算每个类的归一化值,分子是类的指数值,分母是所有类的指数值之和。使用 Softmax 函数,我们得到 0 到 1 之间的所有值,所有值的总和变为等于 1。因此人们将其视为概率,这是他们的误解。
它如何使用 argmax() 函数?


在对每个类应用上述数学函数后,Softmax 会为每个类计算一个介于 0 和 1 之间的值。
现在我们每个类都有几个值,为了分类输入属于哪个类,Softmax 使用 argmax() 给出了应用 Softmax 后具有最大值的值的索引。
图片argmax 的可视化解释
为什么 Softmax 只用在神经网络的最后一层?


现在进入重要部分,Softmax 仅用于最后一层以对值进行归一化,而其他激活函数(relu、leaky relu、sigmoid 和其他各种)用于内层
如果我们看到其他激活函数,如 relu、leaky relu 和 sigmoid,它们都使用唯一的单个值来带来非线性。他们看不到其他值是什么。
但是在 Softmax 函数中,在分母中,它取所有指数值的总和来归一化所有类的值。它考虑了范围内所有类的值,这就是我们在最后一层使用它的原因。要通过分析所有的值来知道Input属于哪个类。图片最后一层的 Softmax 激活函数
对 Softmax 的误解
关于 Softmax 的第一个也是最大的误解是,它通过归一化值的输出是每个类的概率值,这完全错误。这种误解是因为这些值的总和为 1,但它们只是归一化值而不是类的概率。
图片
在最后一层并不是单独使用 Sotmax,我们更喜欢使用 Log Softmax,它只是对来自 Softmax 函数的归一化值进行对数。
Log Softmax 在数值稳定性、更便宜的模型训练成本和 Penalizes Large error(误差越大惩罚越大)方面优于 Softmax。
这就是在神经网络中用作激活函数的 Softmax 函数。相信读完本文后你对它已经有了一个清楚的了解。
原文链接:https://medium.com/artificialis/softmax-function-and-misconception-4248917e5a1c



专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: AI

相关推荐

紧凑型集成连接器模块抑制噪声 为人工智能应用实现以太网供电

基于Microchip MCU的AI/ML培训教程1

视频 2025-11-12

赋能边缘端对话式人工智能

基于Microchip MCU的AI/ML培训教程3

视频 2025-11-12

AI竞争进入下半场:从“卷参数”到“卷单价”

2026-05-22

电子元件培训教材

基于Microchip MCU的AI/ML培训教程2

视频 2025-11-12

Nigel AI赋能LabVIEW,NI用AI重塑测试新边界

2026-05-22

英伟达CFO:我们早就知道内存大涨价要来了

2026-05-24

尼吉康的事业介绍

视频 2025-07-25

AI热潮引发多层陶瓷电容MLCC供应短缺

AI 驱动估值飙升:光通信半导体企业市值暴涨

GPU:面临工作负载转变的高吞吐架构

EEPW2018年6月刊(5G)

资源下载 2018-06-11

研华 COMPUTEX 首度整合全球伙伴大会 强化全球边缘 AI 生态系统联结

EEPW2018年3月刊(工业物联网)

爱立信携手 Net Feasa 布局海事网络 融合公网级通信与智能体 AI 赋能航运

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

视频 2025-12-19

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 2017-12-14
更多 培训课堂
更多 焦点
更多 视频

技术专区