边缘视觉 AI 的理想平台
特性比较
本文引用地址:https://www.eepw.com.cn/article/202106/426416.htm表 1 是 Kria K26 SOM 与英伟达 Jetson Nano 和英伟达 Jetson TX2 的特性比较。
表1 K26 SOM与英伟达 Jetson 特性比较
编号 | 特性 | 赛灵思 K26 SOM | 英伟达 Jetson Nano(1) | 英伟达 Jetson TX2(1) |
1 | 应用处理器 | 四核 Arm® Cortex®-A53 MPCore™,最高主频 1.5GHz |
四核 Arm Cortex-A57 MPCore 处理器 | 四核英伟达 Denver 2 64 位 CPU 和四核 Arm Cortex-A57 MPCore处理器 |
实时处理器 | 四核 Arm Cortex-R5F MPCore,最高主频 600MHz | |||
2 | GPU | Mali™-400 Mp2,最高主频 667MHz (主要用于图形渲染) |
128 核英伟达 Maxwell GPU |
256 核英伟达 Pascal GPU |
3 | 机器学习吞吐量 | 1.36TOPS(2) | 472GFLOP(FP16) | 1.33TFLOP (FP16) 面向 TX2i 为 1.26TFLOP |
4 |
摄像头接口 | MIPI: 多达 44 个 DPHY2.0 通道,最多支持 11 个摄像头 每接口最大带宽10Gb/s 每接口最多 16 个虚拟通道 |
12 个 DPHY1.1 x 4 通道,最多支持 4 个摄像头,每接口最大带宽 6Gb/s |
12 个 DPHY1.1 通道,最多支持 6 个摄像头,每摄像头最大带宽 6Gb/s |
SLVS、LVDS: 11 个 x4 SLVS 或 LVDS 摄像头接口 |
NA |
NA | ||
SLVS-EC: 4 个通道,每通道 5Gb/s | NA | NA | ||
5 |
显示接口 |
DP1.2 x2 通道 | 2x HDMI 2.0、 DP 1.2、 eDP 1.2、 2x MIPI DSI x2通道(1.5Gb/s/通道) | 2x HDMI 2.0、DP 1.2、eDP 1.2、2x MIPI DSI |
附加 HDMI 2.0 (GT)、 配备软 IP 的 DisplayPort 1.4 (GT)、 配备软 IP 的 MIPI DSI x4 通道(2.5Gb/s/通道) |
NA |
NA | ||
6 |
视频编码H.264/H.265 |
最多 32 个并发流、 最高分辨率 4K @60FPS 色彩格式:422 8/10 bpc和 420 8/10bpc |
最多 9 个流;最高分辨率 4K @30 FPS 420 8bpc |
最多 8 个 H.265 流,14 个 H.264 流,最高分辨率 4K @60FPS 420 8bpc |
7 |
视频解码 H.264/H.265 |
最多 32 个并发流, 最高分辨率 4K @60FPS 色彩格式:422 8/10bpc和 420 8/10bpc | 最多 9 个流;最高分辨率 4K @60 FPS 420 8bpc |
最多 32 个 H.265 流,16 个 H.264 流,最高分辨率 4K @60FPS 420 8bpc |
表1 K26 SOM与英伟达 Jetson 特性比较(续)
编号 | 特性 | 赛灵思 K26 SOM | 英伟达 Jetson Nano(1) | 英伟达 Jetson TX2(1) |
8 |
无线 |
GTR M.2/SATA |
载频上的 M.2 Key-E 站点 | 802.11a/b/g/n/ac 2×2 867Mb/s | 模块上的 Bluetooth 4.1 BCM4354 |
9 |
以太网 | 4x 10/100/1000 Base-T 以太网 HP I/O 内配备软 IP 的附加以太网端口 |
10/100/1000 Base-T 以太网 |
10/100/1000 Base-T 以太网 |
10 | USB | 2x USB3.0、2x USB2.0 | 4x USB 3.0 + Micro-USB 2.0 | USB 3.0 + USB 2.0 |
11 |
PCIe® | PCIe Gen2 x 4 在 GT 上配备软 IP 的PCIe Gen3 x4 |
PCIe Gen2 x4 通道 |
PCIe Gen2 x5 通道 |
12 |
高速 I/O (GT) 提供附加接口支持 |
可编程逻辑中的 4x GTH 收发器可通过配置,支持多种类型的高速协议,如 SLVS - EC、PCIe Gen 3、HDMI、 10GE等等……。 |
NA |
NA |
13 |
I/O 灵活性 |
69 3.3V I/O、116 1.8V I/O 允许用户在可编程逻辑内创建高度灵活且可配置的 I/O 接口 |
NA |
NA |
14 |
可编程逻辑 |
25.6 万个系统逻辑单元、1248 个 DSP、26.6Mb 片上 存储器,便于用户为视觉和ML 功能实施定制加速器 |
NA |
NA |
15 | DRAM | 4GB 64 位 DDR4 | 4GB 64 位 DDR4 | 8GB 128 位 LPDDR4? |
16 | eMMC | 16GB | 16GB | 32GB |
17 | 闪存 | 512MB QSPI | NA | NA |
18 | 插槽载卡接口 | 两个 240 针连接器 | 260 针边缘连接器 | 400 针板对板连接器 |
说明:
1.来源:https://developer.nvidia.com/embedded/jetson-modules
2.深度学习处理器的性能基于333MHz 主频下的赛灵思 DPU 配置 B4096,其实现在可编程逻辑内。
K26 SOM 基于 Zynq UltraScale+ MPSoC 架构。它内置一个 64 位的四核 Arm® Cortex™-A53 应用处理器组,并配套一个 32 位的双核 Arm Cortex-R5F 实时处理器和一个 Arm Mali™-400MP2 3D 图形处理器。SOM 上还包括 4GB 的 64 位 DDR4 存储器和 QSPI 与 eMMC 存储器。采用 Zynq UltraScale+ 架构内置的硬件可信根实现的固有的安全启动功能,通过外部 TPM2.0 扩展用于测量启动并遵循 IEC 62443 规范。
该 SOM 提供了 25.6 万个系统逻辑单元、1248 个 DSP、26.6Mb 的片上内存。它为用户实现应用专用设计并以最低功耗获得最佳性能提供了一个灵活的平台。以 B4096 (1.4TOP) 为性能上限,用户能够实现多种 DPU 变体,用于满足机器学习需求,以及用于视觉功能和可编程逻辑中的 ML 预处理和后处理的额外硬件加速器。此外,该 SOM 还为 H.264/H.265 提供了内置的视频编解码器。该编解码器可支持最多 32 个编码、解码并发流,只要视频总像素在 60FPS 下不超过 3840x2160P。该编解码器支持高画质4:2:2 8/10bpc和 4:2:0 8/10bpc。
K26 SOM 的主要优势之一是它拥有无与伦比的 I/O 灵活性。它拥有大量的 1.8V、3.3V 单端与差分 I/O,四个 6Gb/s 收发器和四个 12.5Gb/s 收发器。这便于用户让每个 SOM 支持更多的图像传感器以及多种传感器接口类型,其中包括 ASSP 和 GPU通常不支持的 MIPI、LVDS、SLVS 和SLVS-EC。此外,用户还能在可编程逻辑中实现 DisplayPort、HDMI、PCIe®、USB2.0/3.0 等标准,包括用户定义的标准。
K26 SOM 的尺寸是 77mm x 60mm x 11mm。根据 SOM 的未来发展规划,SOM 的尺寸将大幅缩小,能够为
应用提供支持。商用级 K26 SOM 支持的工作温度范围是结温 0°C 至 +85°C,以内置温度传感器向应用处理器报告的温度为准。SOM 上的全部其他器件均以该测量温度为准绳。类似地,工业级 K26 SOM 支持的工作温度范围是 –40°C 至 +100°C。
在特性之外,还应该了解和分析深度学习网络如何在每个器件上运行。这将在下文中进行详细研讨,其中包括在复杂性相似的网络上对类似器件进行比较。
评论