新闻中心

EEPW首页 > 业界动态 > 实例！详解FPGA如何实现FP16格式点积级联运算

实例！详解FPGA如何实现FP16格式点积级联运算

作者：Achronix资深现场应用工程师,杨宇时间：2020-08-14 来源：电子产品世界

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

收藏

编者按：通过使用Achronix Speedster7t FPGA中的机器学习加速器MLP72，开发人员可以轻松选择浮点/定点格式和多种位宽，或快速应用块浮点，并通过内部级联可以达到理想性能。

神经网络架构中的核心之一就是卷积层，卷积的最基本操作就是点积。向量乘法的结果是向量的每个元素的总和相乘在一起，通常称之为点积。此向量乘法如下所示：

本文引用地址：https://www.eepw.com.cn/article/202008/417088.htm

图1 点积操作

该总和S由每个矢量元素的总和相乘而成，因此S=a₁b₁+a₂b₂+a₃b₃+···a_nb_n

本文讲述的是使用FP16格式的点积运算实例，展示了MLP72支持的数字类型和乘数的范围。

此设计实现了同时处理8对FP16输入的点积。该设计包含四个MLP72，使用MLP内部的级联路径连接。每个MLP72将两个并行乘法的结果相加（即a_ib_i+a_i+a_i+1b_i+1），每个乘法都是i_a输入乘以i_b输入（均为FP16格式）的结果。来自每个MLP72的总和沿着MLP72的列级联到上面的下一个MLP72块。在最后一个MLP72中，在每个周期上，计算八个并行FP16乘法的总和。

最终结果是多个输入周期内的累加总和，其中累加由i_first和i_last输入控制。 i_first输入信号指示累加和归零的第一组输入。 i_last信号指示要累加和加到累加的最后一组输入。最终的i_last值可在之后的六个周期使用，并使用i_last o_valid进行限定。两次运算之间可以无空拍。

● 配置说明

表 1 FP16点积配置表

● 端口说明

表2 FP16点积端口说明表

● 时序图

图2 FP16点积时序图

其中，

● 进位链

首先请看下图，MLP之间的进位链结构，这是MLP内部的专用走线，可以保证级联的高效执行。

图3 MLP进位链

● 乘法阶段

下图是MLP中浮点乘法功能阶段，其中寄存器代表一级可选延迟。

图4 MLP乘法功能阶段框图

MLP72浮点乘法级包括两个24位全浮点乘法器和一个24位全浮点加法器。两个乘法器执行A×B和C×D的并行计算。加法器将两个结果相加得到A×B + C×D。

乘法阶段有两个输出。下半部分输出可以在A×B或（A×B + C×D）之间选择。上半部分输出始终为C×D。

乘法器和加法器使用的数字格式由字节选择参数以及和参数设置的格式确定。

浮点输出具有与整数输出级相同的路径和结构。MLP72可以配置为在特定阶段选择整数或等效浮点输入。输出支持两个24位全浮点加法器，可以对其进行加法或累加配置。进一步可以加载加法器（开始累加），可以将其设置为减法，并支持可选的舍入模式。

最终输出阶段支持将浮点输出格式化为MLP72支持的三种浮点格式中的任何一种。此功能使MLP72可以外部支持大小一致的浮点输入和输出（例如fp16或bfloat16），而在内部以fp24执行所有计算。

图5 MLP浮点输出阶段框图

需要强调的是本设计输入和输出都是FP16格式，中间计算过程，即进位链上的fwdo_out和fwdi_dout 都是FP24格式。具体逻辑框图如下所示：

图 6 FP16点积逻辑框图

MLP内部数据流示意图：

图7 FP16点积在MLP内部数据流图

最终ACE的时序结果如下：

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词：

评论

相关推荐

Spansion飞索半导体FL-S高速闪存系列新闻发布会

视频 Spansion 闪存 | 2011-11-18

SiC JFET并联的五大难题，破解方法终于来了！

电源与新能源设计指南并联振荡栅极驱动器 | 2025-03-05

吊扇自动控制电路

设计方案吊扇自动控制 | 2009-07-06

Spansion公司战略产品营销副总裁Robert France 访谈

视频 Spansion 闪存 | 2011-11-18

速看！SiC JFET并联设计白皮书完整版

电源与新能源 SiC JFET 并联设计 | 2025-03-05

电风扇多功能控制电路(LC903)

设计方案电风扇多功能控制 LC903 | 2009-07-06

TI Smart Motor Driver

视频 TI 电机控制 | 2011-11-15

光电传感器开关的使用及背部旋钮调节的作用

物联网与传感器传感器光电传感器 | 2025-03-05

基于DIODES ZXMS81045SPQ车规智能的高边驱动方案

汽车电子 DIODES ZXMS81045SPQ 车规智能高边驱动 | 2025-03-05

Linux Bible RedHat.part4

资源下载 ebook Linux Bible RedHat | 2007-02-28

转向纳米晶体管是SRAM的福音

网络与存储纳米晶体管 SRAM 英特尔 Synopsys TSMC 内存密度 | 2025-03-05

关于hy29f040烧写的问题？

zhangkaiyu | 2004-12-02

开关模式电源（Switch Mode Power Supply，简称SMPS）

电源与新能源开关模式电源，Switch Mode Power Supply，SMPS | 2025-03-05

交流电机控制方法及实现

视频交流电机电机控制 | 2011-11-15

电风扇自编程程控电路(LM6402)

设计方案电风扇编程程控 LM6402 | 2009-07-06

电风扇程控电路(MC6338)

设计方案电风扇程控 MC6338 | 2009-07-06

linux - Advanced Bash Shell Scripting Guide

资源下载 ebook linux Advanced Bash Shell Scripting Guide | 2007-02-28

Linux Bible RedHat.part1

资源下载 Linux Bible RedHat | 2007-02-28

SiC JFET并联难题大揭秘，这些挑战让工程师 “头秃”！

电源与新能源 JFET Cascode 功率半导体 | 2025-03-05

XoMotion自平衡外骨骼机让脊髓损伤患者站起来跳舞

医疗电子 XoMotion 自平衡外骨骼机 | 2025-03-05

Linux Bible RedHat.part3

资源下载 ebook Linux Bible RedHat | 2007-02-28

台积电加注美国制造将改变整个半导体格局

EDA/PCB 半导体台积电先进制程先进封装 | 2025-03-05

串口通讯问题

yjg1202 | 2004-12-02

[注意]全新极品原装PowerPC评估板转让，带原装Ravean仿真器

boreas | 2004-12-02

大型高档游戏机主板MU－Zealer介绍（1）－新一代游戏平台

游戏开发 | 2004-12-02

Linux Bible RedHat.part2

资源下载 ebook Linux Bible RedHat | 2007-02-28

恩智浦集成式硅压力传感器的技术突破与应用革新

物联网与传感器恩智浦压力传感器选型推荐 | 2025-03-05

用pc机的usb口实现串口通讯????

xiangjing | 2004-12-02

飞思卡尔完善的永磁同步电机无位置传感器矢量控制解决方案

视频 Freescale 永磁同步电机 | 2011-11-15

电风扇程控电路(RY901)

设计方案电风扇程控 RY901 | 2009-07-06

焦点

推荐视频

技术专区

关闭