全球麦克风与音频处理器出货预测

作者：时间：2016-09-06 来源：eettaiwan

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

　　在先进驾驶辅助系统(ADAS)中，结合视觉处理器的CMOS影像感测器已在协助汽车辨识与分类方面发挥关键作用。至于其“听觉”呢?

本文引用地址：https://www.eepw.com.cn/article/201609/296558.htm

　　麦克风也能扮演像摄影机般重要的角色，为自动驾驶车增添更多“智慧”功能吗?

　　DSP Concepts执行长与创办人Paul Beckmann表示，在汽车和驾驶人发现救护车接近以前，就已经听到它的警报声响起了。那么为什么汽车产业不会对音讯感兴趣?

　　系统OEM厂商(不只是汽车制造商)目前正处于“使用更多麦克风以便为人工智慧(AI)产生另一种重要感测器资料——音讯”的关键时刻，Beckmann解释。

　　正如他所预设的，音讯正“从单纯的在娱乐系统中播放，朝向在情境架构中实现输入、触发与分析。”

　　由 麦克风所拾取的智慧，也可能用于日常生活的各种系统中，从汽车、数位虚拟助理到可携式装置等。“视觉与听觉应该并驾齐驱，”DSP Concepts业务与行销执行总裁Willard Tu表示。“狗吠声、婴儿哭闹、玻璃碎裂、汽车喇叭、警报声与枪声等等......音讯有助于让系统更有效地掌握环境[和情境]。”

　　图1：音讯“输入”演算法发展蓝图 (来源：DSP Concepts)

　　如今，有两个重要的发展趋势推动电子产业突然在音讯领域迅速发展。

　　一是拥有多颗麦克风的智慧型手机普及;其次则是数位虚拟助理的流行，如Amazon Echo与Google Home。根据SAR Insight & Consulting总监与首席分析师Peter Cooney的观察，“一般消费装置中整合虚拟数位助理的应用越来越多，带动感知与采用语音作为自然的使用者介面，应用于许多日常任务中。”

　　但是，麦克风能多快超越作为一种自然使用者介面的角色，开始变成真正的‘智慧感测器’?看来业界还得等待一些进展。

　　为了迎接挑战，音讯需要可以拾取更佳音质的麦克风、善于后处于音讯的处理器、预处理音讯的有效演算法、易于使用的音讯处理工具、相当于绘图用Open GL的音讯标准，以及能以最小功耗维持永不断线的麦克风。

　　总之，如同Cooney所指出的，市场需要“始终保持监听的技术、语音增强演算法以及麦克风。”

　　在ARM处理器上实现音讯处理

　　音讯处理以往是播放系统(如TV、DVD和Hi-Fi音响系统中的等化器)才需要的专业领域。

　　而今在智慧型手机和其他家用装置的麦克风普及带动下，音讯处理任务已经扩展到几乎无处不在。专用音讯DSP也并不是系统中处理音讯的唯一晶片了。

　　随着越来越多的音讯开始在ARM处理器上执行，Beckmann指出，更多的OEM“热切地将麦克风视为”AI的输入感测器。DSP Concepts正处于观察这一市场过渡的最佳位置。

　　Beckmann看好市场成长的态势，特别是因为该公司一款称为Audio Weaver在过去一年来的成果。如同Beckmann描述的，这是“唯一一款可跨平台作业的绘图音讯设计架构。”

　　业界分析家认为，DSP Concepts正占据音讯市场上的独特位置。TECHnalysis Research总裁兼首席分析师Bob O'Donnell认为：“我并未看到DSP Concepts或其Audio Weave工具面对哪几家竞争对手。许多公司都针对音乐与录音等目的进行专业的音讯剪辑与音讯处理，但这毕竟是不同的领域。”

　　库尼表示同意。“我不知道任何竞争产品音频织女的。”他补充说，“DSP概念有其他的产品也是如此，如声音增强算法(噪音抑制，回声取消，波束赋形)，基准和参考设计。”

　　Cooney也同意这一看法。“我还不知道Audio Weaver有任何竞对手。”他补充说，“DSP Concepts也有其他的产品，例如声音增强演算法(杂讯抑制、回音消除、波木成形等)、基准与参考设计。”

　　图2：全球麦克风与音讯处理器市场 (来源：SAR Insights & Consulting)

　　DSP Concepts并未设计或销售DSP。然而，竞争对手一般都是其他的DSP业者。Audio Weaver的竞争产品来自德州仪器(TI)或Cirrus Logic等DSP供应商自行打造的音讯工具。其差异之处在于那些内部开发的工具仅用于DSP供应商自家的晶片。而采用像Audio Weaver这样的独立平台工具，Tu强调，“OEM不必被限制于一种特定的DSP。”

　　Cooney说，DSP Concepts藉由与Cadence/Tensilica等许多公司合作，主要的业务在于为其客户提供音讯设计解决方案。

　　除了Audio Weaver工具，DSP Concepts也授权一些可形成麦克风输入的音讯演算法，包括波束成形、回声消除、杂讯消除与远音场(far-field sound)等演算法。Beckmann指出，在此业界缺乏深谙音讯处理的工程人才之际，市场亟需易于使用的音讯预处理演算法，以便能从不需要的环境杂讯中区隔出声音来。

　　音讯：长期受冷落的领域

　　然而，目前使用音讯进行声学事件检测(和分析)仍然是一种相对较新的应用。

　　O’Donnell指出，“理论上，可能会有更多专用音讯处理器在做AI，但坦白说，音讯就像是长期受到视讯的冷落一样，而且时至今日也是如此。”

　　他补充说，声音的另一项重大挑战是“语言与意义”。他说，“一张树的图片以任何语言来说是树，但要瞭解字、词以及最重要的意义与意图，就具有语言与文化的独特性了。这使得语音辨识与自然语言的处理变得十分困难。”

　　Beckmann坦承，音讯缺乏标准，也造成了差距。

　　以OpenGL来看，它是一种针对图形渲染的跨语言、跨平台API。对于想要编写程式码的视讯游戏设计人员来说，这种API十分重要。像Nvidia等GPU供应商在使用这种API后就能最佳化其硬体。

　　音讯世界则可以使用硬体抽象层来实现跨平台的硬体加速渲染，类似于OpenGL所扮演的角色一样。如果缺乏标准，每一家音讯晶片公司都必须最佳化自家硬体以及自给自足。缺乏标准延缓了扩展跨平台的音讯应用所需的创新脚步。

　　实现永不断电的续航力

　　Amazon Echo或Google Home等流行的数位虚拟助理下一步要实现的就是“长时倾听”(always-listening)的能力。Amazon正透过其‘tap-then- speak’的语音启动机制加速这方面的进展。但该装置还不能称得上是‘always listening’。

　　图3：全球语音介面与长时倾听技术市场 (来源：SAR Insights & Consulting)

　　具有永不断线/长时倾听能力的装置一旦走出家门，将开始面临各种挑战。到了户外，它的音讯处理能力必须从背景杂讯中区隔出需要听到的声音。此外，Beckmann强调，更大的问题还在于电池寿命。

　　为此，他指出，“位于波士顿的新创公司Vesper开发的静态感测MEMS元件就十分关键。”Vesper专门开发压电MEMS麦克风，不久前还发布了一款新的声学感测器，可利用声能唤醒完全待机中的系统。

　　Vesper 执行长Matt Crowley表示，这款新的压电MEMS麦克风VM1010可在倾听模式下汲取仅3μA电流，该元件预计在今年第四季出样。Crowley并承诺，VM1010的新版本将会配备“鉴频”(frequency discrimination)功能。这表示系统设计者可因应枪声、玻璃粉碎或人声等特定的杂讯特性编程MEMS麦克风。

　　汽车内部

　　回过头来看看汽车内部的音讯应用。语音为汽车内部提供了自然的人机介面(HMI)。

　　为了提高驾驶人使用免持听筒的语音品质，一线业者与汽车OEM严重地依赖音讯处理技术。Beckmann说，“配备多声道(从8-32声道)扬声器的汽车，带来了十分复杂的音讯系统。”

　　不仅如此，随着电动车的出现，汽车产业开始使用假引擎噪音——或“电子声音”。从BMW到福斯(Volkswagen)等越来越多的汽车制造商开始玩各种共鸣放大器技巧。事实上，不只是电动车，当今更省油的引擎声音更安静，也较不那么有力了。汽车制造商担心所有的平静可能会让潜在买家却步。

　　对于汽车产业的许多人来说，音讯是熟悉的领域。汽车制造商们知道，音讯可以为其提供差异化。车内的声学感测器不仅可以听到外面发生的事情，未来，车子自己的引擎也能够针对诊断应用侦测任何异常情况。