专栏中心

EEPW首页 > 专栏 > 可微编程:打开深度学习的黑盒子(2)

可微编程:打开深度学习的黑盒子(2)

发布人:深度学习大讲堂 时间:2020-12-04 来源:工程师 发布文章

14.jpg

另外,在2015的ICCV上《Conditional Random Fields as Recurrent Neural Networks》文章中提出,把条件随机场的求解变形成了循环神经网络的相关运算,在图像语义分割上实现了突破。

13.jpg

在2016的TPAMI上《Learning to Diffuse: A New Perspective of Designing PDEs for Visual Analysis》文章中,提出的PDE工作在多个任务视觉上取得很好的效果。

12.jpg

在2016的TIP《Learning Iteration-wise Generalized Shrinkage-Thresholding Operators for Blind Deconvolution》里,针对盲卷积这个问题,发展出能够实现稀疏编码的回复神经网络。

11.jpg

在2016的IEEE TPAMI的《Trainable Nonlinear Reaction Diffusion: A Flexible Framework for Fast and Effective Image Restoration》文章中,对图像重构工作进行了这方面研究。

10.jpg

在2016年的AAAI文章《Learning Deep ℓ0 Encoders》中对0范数的优化问题,进行变形和等价建议的回复式神经网络。

9.jpg

在2015年TPAMI文章《Learning Efficient Sparse and Low Rank Models》中,对使用深度神经网络来实现稀疏模型和非负矩阵分解之间建模的回复式神经网络。

8.jpg

将这些研究进行归纳总结,就是把一些现有的统计机器学习方法,特别是现有的优化过程展开,形成一个简单的神经网络,且其中大多都是一个简单的回复式神经网络。从而使它能享有传统机器学习的优点,比如端到端学习,同时兼具易于优化以及高可解释性等优点。

我相信这样介绍大家可以有一个直观的概念。目前可微编程就是对传统的机器学习的一个逆向的过程,由于传统的机器学习的结构非常清晰,对逆向过程可以产生的神经网络,就可以知道哪一个激活函数的作用是什么,每一层的输出、目的是什么,这也是现有的深度学习方法所不具备的优势。

7.jpg

下面给大家介绍一下我们的第一个工作。我们这项工作从可微编程出发,来研究稀疏编码的优化方法—ISTA 。

6.jpg

目前,常见的对L1范数优化的方法具有四个局限性:

第一,在优化过程中,对于每一个变量的更新都是采用固定的学习率。所以没有考虑优化变量的每个维度之间的不同。

第二, 这些优化过程并没有考虑历史信息。但是在优化这个研究邻域里已经有大量的工作证明如果考虑历史信息,能够加速算法的收敛。

基于这两点不足,我们提出了自适应的ISTA算法。

5.jpg

还有两个不足是什么呢?

第三,在稀疏编码推理过程中,计算代价很高。

第四,稀疏表示矩阵计算和字典学习是两个分隔开的步骤。但现在流行端到端的训练,也就是同时优化步骤,这样做可能会产生次优的解。

而这两个不足,正好是可微编程能够克服的问题。因此基于这些问题,我们对自适应的ISTA变形和展开提出新的神经网络——SC2Net。

4.jpg3.jpg

左边是ISTA的关键的优化步骤,基于此,我们引进了动量向量(i(t),f(t))。这就是标准的受益于现代的优化的一些相关的方法,通过引入这两个量,从而解决非自适应更新问题和没有考虑历史信息的不足。更进一步来看,这里存在一个问题,i(t),f(t)如果是两个向量的话,只能确定它的值。使用传统的机器学习方法进行训练,我们人为指定它的值。在研究中,发现可以把这两个向量当成两个变量从数据中学习,就产生了我们提出的自适应ISTA。

2.jpg

同时,我们还发现这种自适应ISTA可以等价于新的长短期记忆神经网络。具体来看,我们可以认为i和f是等价于LSTM中的input gate 和output gate。但是需要注意的是,和经典的LSTM相比,自适应的ISTA是没有output gate。

1.jpg

基于以上,我们就组建了Sparse LSTM,并且构建了相应的神经网络结构。

专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词:

相关推荐

消息称上汽通用将关闭沈阳北盛工厂,波及约 2000 名员工

主要元件封装图

消息称美国推动英特尔、台积电成立合资芯片代工厂

Comparing Stratix III and Virtex-5 Core Power

视频 2010-03-17

Build up to 96-Port SGMII GigE With Stratix III FPGAs

视频 2010-03-17

即插即用信号完整性视频演示

视频 2010-03-17

主板维修手册

百度宣布文心一言4月1日起全面免费

LoRa联盟发布2024年年度报告

外媒:DeepSeek这四个影响可能将改变世界

NAND闪存再减产:三星、SK海力士将至少削减10%

2025-02-13

实现Stratix III FPGA和1,067-Mbps DDR3存储器的接口

视频 2010-03-17

贸泽开售Analog Devices AD-GMSL2ETH-SL边缘计算平台

40-nm FPGA和8.5 Gbps收发器

视频 2010-03-17

专业术语常用名词缩写中英文对照

受中国订单激增推动,消息称三星平泽晶圆代工全速复产

Nexperia全新推出高精度和超低静态电流的汽车级LDO系列

利用设计工具提高位置传感器系统精度

中文版Verilog HDL简明教程:第4章 表 达 式

中文版Verilog HDL简明教程:第5章 门电平模型化

更多 培训课堂
更多 焦点
更多 视频

技术专区