专栏中心

EEPW首页 > 专栏 > QAT 量化配置的等效构建方法 —— 从 Base 之争到"量化"

QAT 量化配置的等效构建方法 —— 从 Base 之争到"量化"

发布人：地平线开发者时间：2026-05-01 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

一、背景：为什么大家几乎都会从 base_int16 开始？

在 QAT 项目中，只要遇到精度问题，工程师的第一反应通常是：

先上全 int16，看精度上限。

这是完全合理的。

原因：

int16 动态范围更大
量化误差更小
更接近浮点
能快速验证“模型是否具备量化可行性”

如果全 int16 精度仍不好，问题往往不在 bit-width，而在：

scale 分布异常
observer 未收敛
插桩位置不合理
数据分布问题

因此：

base_int16 是“精度上限探测工具”。

这一步是科学且必要的。

二、工程现实：最终目标往往是性能

但真实部署环境通常是：

延时受限
带宽受限
片上存储受限

在这种前提下：

全 int16 基本不可能成为最终部署形态。

所以工程上更合理的路径应该是：

以 base_int8 作为默认底座对精度敏感区域做局部升级

这意味着：

int16 用来探上限
int8 用来做工程

这两个阶段目标不同。

三、真正的困难：从 base_int16 切回 base_int8

问题往往出现在这里。

当我们在 base_int16 下完成精度探索后，会得到大量细节信息：

哪些 layer 敏感
哪些 layer 需要 fix_scale
哪些模块 output 必须 int16
哪些 Conv / Matmul 必须 int16 输入

但当切换到 base_int8 时，会发现：

默认 ModuleNameTemplate 不同
默认 ConvDtypeTemplate 不同
默认 MatmulDtypeTemplate 不同
输出 dtype 传播链改变

结果：

相同 prefix 写法，生效行为完全不同。

这就意味着：

base_int16 的配置不能直接复制到 base_int8。

四、问题的本质：不要让 base 决定量化形态

量化系统本质是“分层覆盖系统”。

如果让 base 决定形态，你就会被 base 牵着走。

真正应该控制的是：

每个模块最终生效的 dtype 拓扑。

五、方法论框架：量化拓扑设计

整个方法可以抽象为五个阶段：

1. 精度上限探测（全 int16）
2. 敏感层识别
3. 结构分析
4. 等效拓扑构建
5. int8 工程落地

我们逐步展开。

六、第一阶段：全 int16 精度上限探测

典型配置：

ModuleNameTemplate({"": qint16})
ConvDtypeTemplate(input_dtype=qint16, weight_dtype=qint8)
MatmulDtypeTemplate(input_dtypes=qint16)

目标：

验证量化可行性
建立精度上限参考

七、第二阶段：使用 GlobalFakequantSwitch 定位问题

无论哪种路径，都建议使用：

GlobalFakeQuantSwitch.disable()
需要去量化的操作
GlobalFakeQuantSwitch.enable()

典型使用思路：

全局关闭 FakeQuant
单模块开启
或单模块关闭

确认：

精度损失是否来自 bit-width
是否来自 scale 更新
是否来自某个具体模块

这一步可以避免盲目升位宽。

八、第三阶段：基于模型结构识别敏感模块

量化配置必须依赖模型结构。

例如：

backbone 多为线性卷积 → int8 风险低
head 中 aggregation / attention → 敏感

必须回答：

哪些模块属于 backbone？
哪些属于 neck？
哪些属于 head？
哪些包含 matmul？
哪些包含 feature aggregation？

没有结构分析，就没有精准升级。

九、第四阶段：构建“等效量化拓扑”

核心思想：

默认 int8 + 精准 prefix 升级

Step 1：统一默认 base_int8

ModuleNameTemplate({"": qint8})
ConvDtypeTemplate(input_dtype=qint8, weight_dtype=qint8)
MatmulDtypeTemplate(input_dtypes=qint8)

这是性能底座。

Step 2：定义敏感模块列表

int16_modules = [
    "head.anchor_encoder",
    "head.lidar_shared_conv",
    "head.layers",
]

Step 3：输出 dtype 升级

ModuleNameTemplate({
    name: qint16 for name in int16_modules
})

Step 4：Conv 输入升级

ConvDtypeTemplate(
    input_dtype=qint16,
    weight_dtype=qint8,
    prefix=int16_modules
)

Step 5：Matmul 输入升级

MatmulDtypeTemplate(
    input_dtypes=qint16,
    prefix=int16_modules
)

十、等效性的关键点

如果你在 base_int16 下：

backbone output=int8
head output=int16

那么你必须保证：

在 base_int8 下通过 prefix 升级后，

每个模块最终 output dtype 完全一致。

验证方法：

打印每层最终 dtype
单层剔除测试
对比精度曲线

十一、fix_scale 的位置

fix_scale 与 dtype 是两个维度：

dtype 控制动态范围
fix_scale 控制 scale 是否锁定

某些 head 模块：

可能必须 int16
也可能必须 fix_scale

但不要把 fix_scale 当成“精度万能补丁”。

十二、工程调优路径建议

推荐流程：

全 int8 → 测性能
全 int16 → 测精度上限
GlobalFakequantSwitch 定位问题
结构分析敏感模块
构建统一 int8 base
prefix 升级
单层剔除
构建精度-性能 Pareto 曲线

十三、常见误区❌ 误区 1：int16 一定比 int8 精度高

实际很多 backbone 层 int8 几乎无损。

❌ 误区 2：回退法可以长期维护

回退法适合探测上限，不适合工程维护。

❌ 误区 3：忽略输出 dtype 传播

输出 dtype 会影响下游模块。

十四、最终总结

量化优化不是：

从 int16 往下退
从 int8 往上加

而是：

设计一个清晰、可迁移、可验证的量化拓扑结构。

当我们做到：

base 可替换
prefix 可迁移
最终 dtype 可验证
FakeQuant 可局部控制

我们就掌握了 QAT 的量化配置体系。

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词：算法 自动驾驶 算法工具链 地平线 征程5

采用Mean-Shift和Camshift算法相结合的火焰视频图像跟踪设计

设计方案采用 Mean-Shift Camshift 算法相结合 2011-06-27

76-81GHz自动驾驶CMOS RADAR

查看我们创新型高度集成式28nm CMOS RADAR雷达解决方案的系统级演示，该方案将角分辨率指数级升高，以支持面向OEM、一级厂商、创业公司和颠覆性初创公司的高度自动化的驾驶应用。了解有关汽车解决方案的更多信息...

视频 ADI 自动驾驶 CMOS RADAR 2018-05-31

计算机科学与技术反思录(2)

liujt_ic 2003-06-06

有关指纹算法

wsf999 2004-08-06

简单实用的单片机CRC 快速算法

提供两个实用的、能够在单片机上通过软件来实现的CRC 快速算法，其中一个适用于51 系列等单片机，另一个适用于PIC 单片机，这两种算法十分简单快捷。...

资源下载 CRC 算法单片机 2007-02-16

基于LPC2138的血压测量算法开发平台电路图

设计方案基于 LPC2138 血压测量算法开发平台电路图 2010-01-20

Ouster推出 Rev8 OS 激光雷达系列原生彩色激光雷达正式落地

奥斯特（Ouster）正式推出Rev8 OS 数字激光雷达传感器系列，该产品基于公司自研 L4 级 Ouster Silicon 芯片架构打造，面向自动驾驶、机器人、智能基建及工业感知场景。新品系列首次搭载原生彩色激光雷...

汽车电子自动驾驶机器人 2026-05-13

无线传感器网络低功耗分簇路由算法设计

设计方案无线传感器网络功耗路由算法设计 2012-09-07

高阶智驾要落地，线控底盘为什么必须执行得准

高阶智驾继续落地后，车辆不能只依赖感知和决策，线控转向、线控制动和主动悬架等底盘执行系统也要更准、更稳。本文结合 Allegro 在线控底盘、48V、传感器、电机驱动、电源管理和功能安全方面的分享，分析底盘电子化对汽车半...

汽车电子线控底盘智能底盘 Allegro 汽车电子 48V 功能安全电流传感器位置传感器电机驱动电源管理自动驾驶线控制动线控转向 2026-05-09

加密算法之MD5算法

加密算法之MD5算法...

资源下载加密算法加密算法 MD5算法 2007-02-16

vxwokrs下静态图像压缩算法（上）

C-- 2004-07-26

ADI：传感技术助力未来自动驾驶的发展

ADI公司自动驾驶和汽车安全部副总裁Chris Jacobs介绍ADI的传感技术如何助力未来自动驾驶的发展，以及自动驾驶技术如何造福社会和挽救生命。...

视频 ADI 自动驾驶 2020-03-16

2035年自动驾驶出租车市场规模将达1680亿美元

据 Counterpoint Research 最新发布的《全球自动驾驶出租车车辆销售及服务市场预测报告》显示，到 2035 年，全球自动驾驶出租车市场规模预计将达到 1680 亿美元。Counterpoint Rese...

汽车电子自动驾驶 2026-04-21

地平线征程 6 系列集成 Cadence Tensilica Vision DSP，实现规模化量产，合作加速智能驾驶解决方案部署

近日，楷登电子 Cadence 宣布，地平线征程® 6（J6）已成功将 Tensilica Vision DSP 集成至其系统级芯片中，并实现了规模化量产。Cadence Tensilica 将为搭载地平线 J6 系列的...

汽车电子地平线征程 6 Cadence Tensilica Vision DSP 2026-05-13

携手ADI赢得未来

从自动驾驶到医疗健康，我们的客户能够利用相关数据和核心见解展开创新。我们将现实世界转化为可操作的见解，从而不断推动客户实现行业变革。...

视频 ADI 自动驾驶医疗健康 2019-11-08

数字PID控制及其改进算法的应用

设计方案数字控制及其改进算法应用 2011-05-11

曲面显示屏取代传统汽车挡风玻璃

如果某行业 “汽车用户界面” 工作组的提案得以推行，经典的透明玻璃汽车挡风玻璃或将成为历史。取而代之的并非标准的纯被动透视玻璃，而是一块大型曲面显示屏，以电子方式向驾驶员和乘客呈现多个 “画面分区”。中间区域面积最大，显...

汽车电子挡风玻璃曲面显示屏自动驾驶 2026-04-08

掘金自动驾驶，不要把大坑当机会

天下熙熙，皆为利来，天下攘攘，皆为利往。追求财富是现代人类的永恒主题，而股市正是快速获得财富（也是快速破产）的途径之一。虽说追热点死得快，但是，前赴后继的韭菜们依然乐此不疲地追逐着新的热点，幻想着一夜暴富的奇迹。25年年...

汽车电子自动驾驶 2026-04-17

PID算法

PID算法...

资源下载 PID 算法误差 2007-02-16

实时训练驾驶人工智能

自动驾驶是物理 AI 领域难度最高的问题之一。自动驾驶系统必须实时解读混乱、动态变化的环境，应对不确定性、预测人类行为，并在海量场景与极端工况下安全运行。在通用汽车，我们的出发点很简单：道路上绝大多数场景都是可预测的，但...

汽车电子自动驾驶物理 AI 多智能体强化学习模拟器 GM 2026-03-31

目标跟踪算法在红外热成像跟踪技术上的应用

设计方案目标跟踪算法红外成像技术上应用 2009-09-03

自动驾驶正推动汽车行业加速布局人形机器人

自动驾驶技术研发积累与机器人领域高度契合，行业高管预计，到本世纪末，相关市场规模有望突破1000 亿美元。若机器人革命真的到来 —— 许多人对此深信不疑 —— 汽车行业大概率会成为这场变革的核心力量。得益于人工智能技术进...

机器人自动驾驶汽车行业人形机器人 2026-04-17

求FSK信号的解调算法，主要是铁路上的移频信号!

dhlwq007 2004-08-04

面向算法硬件加速的FPGA实现方法

当开发者想要榨干某一算法的极限性能、且软件优化手段已全部用尽时，可以通过软硬件功能重新划分对任务进行硬件加速。借助 FPGA，无需更换处理器、也无需改动电路板级设计，就能轻松将软件模块替换为硬件模块。本文将讲解如何利用 ...

嵌入式系统算法硬件加速 FPGA 2026-04-30

自动驾驶的现状与未来（节选）

在本节选视频中，ADI公司自动交通和汽车安全副总裁Chris Jacobs探讨自动驾驶的现状和未来，及其对社会的影响。...

视频 ADI 自动驾驶 2020-03-16

CRC算法原理及C语言实现

本文从理论上推导出CRC算法实现原理，给出三种分别适应不同计算机或微控制器硬件环境的C语言程序。读者更能根据本算法原理，用不同的语言编写出独特风格更加实用的CRC计算程序。...

资源下载 CRC 算法 C语言 2007-02-16

[转帖]us/os就绪表的维护算法分析

amine 2002-05-17

加快实现自动驾驶（完整小组讨论）

汽车行业正在经历数字化转型，需要处理自动驾驶化方面极为复杂的创新。观看专家小组讨论的视频，其中包括ADI公司自动驾驶和安全事业部副总裁Chris Jacobs。...

视频 ADI 自动驾驶 2020-06-12

特斯拉监督版FSD加入中国市场

5月21日，特斯拉官方宣布监督版FSD的最新布局，其中提到监督版FSD可以在中国使用。根据特斯拉官方定义，FSD Supervised（监督式全自动驾驶）在驾驶员的持续监督下工作，驾驶员需随时准备接管。其核心技术采用“端...

特斯拉 FSD 自动驾驶 2026-05-22

数字PID控制算法之一

数字PID控制算法之一...

资源下载 PID PID控制算法 2007-12-28

更多 培训课堂

更多焦点

更多视频