关 闭

新闻中心

EEPW首页 > 工控自动化 > 设计应用 > 基于LD332O语音识别专用芯片实现的语音控制

基于LD332O语音识别专用芯片实现的语音控制

作者:时间:2012-02-16来源:网络收藏

摘要:机器已经成为人机界面设计的一种重要手段。LD3320作为一款,集成了处理器和一些外部电路,了有限词汇的非特定人语音。文章介绍了LD3320的基本功能、电路设计以及软件的编写。
关键词:语音识别;集成电路;LD3320

0 引言
语音不仅是人与人之间进行信息交流最直接、最方便和最有效的工具,也是人与机器之间进行通信的重要工具。过去的二三十年中,图形用户界面(Graphical User Interface,GUI)作为人与机器的通信接口取得了很大的进展,但使用GUI仍然摆脱不了手的操作,某些场合仍有不便。因此,语音用户界面(Voice User Interface,VUI)成为人们的下一个目标,人们希望通过声音可以对机器发出指令。
语音识别有着非常广泛的应用领域,例如智能家电、智能家居、智能导航、智能玩具等等,这些领域下,语音识别提高了设备的易用性。另外,在某些场合,操作者需要用手其它设备,比如驾驶员驾驶过程中,或者非常强调响应时间,比如军事训练种情况的紧急处置,这些场合不允许操作者进行复杂的操作,语音控制就成为一项必要的选择。
语音识别属于数字信号处理的研究领域,其算法初期是依靠计算机、数字信号处理器等来的,但随着微电子学和集成电路技术的新进展,近年来不断有语音识别集成电路投放市场。其中,ICRoute的LD3320就是一款性价比较高的

1 LD3320芯片介绍
LD3320是一颗非特定人语音识别(SI-ASR,Speaker Independent Automatic Speech Recognition)技术的语音识别/声控芯片。该芯片集成了语音识别处理器和一些外部电路,包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中,即可以语音识别/声控/人机对话功能。
LD3320完成非特定人语音识别,每次识别最多可以设置50项候选识别句,每个识别句可以是单字、词组或短句,长度为不超过10个汉字或者79个字节的拼音串。另一方面,识别句内容可以动态编辑修改,因此可由一个系统支持多种场景。

本文引用地址:http://www.eepw.com.cn/article/161114.htm

a.jpg


芯片采用48脚QFN塑料封装,工作供电为3.3V。芯片内部电路的简要逻辑图如图1所示。其核心是语音以别运算器,配合输入、输出、AD/DA转换等模块,完成语音识别的功能。LD3320还支持并行和串行接口,串行方式可以简化与其他模块的连接。

2 LD3320的应用电路设计
LD3320的基本应用电路由一个微控制器(MCU)和LD3320组成。电路中的主控MCU芯片,是为了完成对LD3320芯片寄存器的操作。
对LD3320芯片的各种操作,都必须通过寄存器的操作来完成。比如设置标志位:读取状态;向FIFO写入数据;识别完成后获得识别结果等。例如在编辑关键词语时,主控MCU通过把关键词语的拼音串设置进LD3320相关寄存器来完成编辑。
其寄存器大体可以分为以下几类,FIFO数据缓存器、语音识别控制寄存器、音量调节、模拟电路和其它的辅助寄存器。寄存器读写操作有2种方式,即标准并行方式和串行SPI方式。LD3320寄存器的地址空间为8位,编号从00H到FFH,可参考文献。
本文选用的主控MCU是51内核的单片机STC10L08XE。演示的软件程序全部烧录在MCU的内置Flash中。主控MCU直接控制LD33203完成所有和语音识别相关的工作。
电源设计可以使用NS公司的LM1117-3.3芯片,为LD3320提供3.3V的电压:音频输入和输出,可以使用柱极体MIC和0.5W的小喇叭;语音识别完成后,为了实现对后续电路的驱动,可以利用MCU的串行口与其它模块进行连接。


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭