新闻中心

EEPW首页 > 消费电子 > 设计应用 > 基于DSP的语音识别计算器设计

基于DSP的语音识别计算器设计

作者: 时间:2010-08-05 来源:网络 收藏

2)将离散谱X(k)通过M个Mel频率滤波器组可得到Mel频谱并通过对数能量的处理,得到对数频谱S(n)。计算S(n)通过每一个滤波器的输出,得到M个h(m)参数。

3)对所有滤波器输出进行对数运算,再进一步进行离散余弦变换(DCT),即可得到MFCC参数。

一般在Mel滤波器的选择中。Mel滤波器组都选择三角形的滤波器,但也可以是其他形状,如正弦形的滤波器组等。
2.4 模板匹配(HMM算法)
本文采用隐马尔科夫模型(HMM算法)进行模式匹配。它将特征矢量作为模板,在模式匹配时,对输人的与模板库中的模板进行比较,最后将相似度最高的作为输出结果。HMM算法解决由于说话人语速不同和连续说话的而带来的失真问题,还能大大减少运算时间,提高率。
隐马尔可夫模型是一个双重随机过程的统计模型,其基本随机过程是隐藏起来观测不到的,另一个随机过程则产生观测序列。对于系统,观测序列0就是矢量量化后的结果序列,模型λ就是由训练语音得到的模板。语音的训练过程就是产生模板λ的过程,而语音的识别过程就是求出在模板λ下,待识别语音的结果序列0的条件概率P[O/λ]。
由α(i)和β(i)的定义可直接得到:P[O/λ]=αt(i)βt(i)。而语音的训练算法则较复杂,目前都采用迭代的方法得到a和b的近似解,其迭代公式如:

在实际应用中,仅对词条的少数次发音进行训练的语音识别系统。不可能对各种复杂语境下的不同发音都有较高的识别率。某些较陈旧的识别算法如动态时间弯曲法,只能把单词的多次训练发音形成多个模板,造成模板数量成倍增加,影响系统的实时性。而HMM能够对一个词的多个训练序列进行有效的融合而形成一个模板。当训练发音的数量增多时,只会造成训练过程的计算量增大。而不会使识别过程的计算量有丝毫增加,这对系统的实时性是相当有利的。

本文引用地址:https://www.eepw.com.cn/article/166656.htm

3 系统测试
针对的使用特点和环境,分别在2个地点测试系统的性能。1)封闭的实验室(地点1),噪声较小,采集的信号较为良好,缺点是有回声。2)课间休息的教室(地点2),噪声及大,干扰很强,信号的采集质量很差。
因为整个系统的是实现的计算功能,因此本次的实验是在系统识别数字和运算符号等语音后在显示器上显示数学运算公式,并在识别出“等于”或“得出”2个词组的语音后显示出“=”和最后的计算结果。
在测试前预先采集5男5女共1 000个语音样本(内容为数字0到100,加、减、乘、除、等于和十、百、千、万等基本计算所需要的数字和运算符号读音),并且对所有样本进行训练。另外找10人(4女,6男)在各实验地点进行实时测试,每人10个,共100个未经训练的样本。用这些样本对系统进行测试,其测试结果如表1所示。


由表l所示,在相同的实验设备条件下,在噪声较小的环境下的系统识别率要远高于在嘈杂的环境下。特别是非经训练的样本在嘈杂环境下的识别率比较低,主要是因为环境中的噪声相当复杂,查看频谱图发现噪声几乎与说话人语音混杂叠加,算法难以识别。

4 结论
本文的语音识别系统,除兼有语音识别的功能,还能对识别的语音信号做进一步处理。由于采用HMM模型对语音信号进行端点检测,大大提高语音信号起止点判断准确性,提高了识别的准确率。由于系统运算复杂。计算量和存储量都很大,同时也需要实时处理语音信号与算法,系统所采用的TMS320VC5509,由于其具有0.05 MW/MIPS的功耗,800 MIPS的运算能力等优越的性能,完全能够满足实时识别功能。实验表明,该计算器系统处理速度快,运行稳定,达到了要求。


上一页 1 2 3 下一页

评论


相关推荐

技术专区

关闭