新闻中心

EEPW首页 > EDA/PCB > 设计应用 > 基于片上系统SoC的孤立词语音识别算法设计

基于片上系统SoC的孤立词语音识别算法设计

作者:时间:2012-04-01来源:网络收藏

3.2 LPCC特征参数提取

LPC参数是模拟人的发声器官的,是一种基于语音合成的特征参数。在实际应用中,使用较多的是由LPC系数推导出的另一种系数,线性预测倒谱系数LPCC(Linear Predictive Ceptrum Coefficients)。

3.2.1线性预测编码LPC算法

LPC模型的基本思想是:对于给定一n时刻采样的语音信号采样值s(n),可以用p个取样值的加权和线性组合来表示[4]。 a1, a2,…, ap称为LPC系数,也是全极点H(z)模型的参数。

7.jpg

cm为倒谱系数,am为线性预测系统,m为倒谱系数的阶数,p为线性预测系统的阶数。这样利用LPC系数通过递推公式可以得到LPCC参数。LPCC由于利用了线性预测中声道系统函数的最小相位特性,避免了相位卷积、求复对数

3.3 基于DTW的模式匹配

3.3.1 动态时间规整DTW算法

存入模板库的各个词条称为参考模板,一个参考模板可表示为R={R(1), R(2),…, R(m),…, R(M)}。m为训练语音帧的时序标号,m =1为起点语音帧,m =M为终点语音帧,M为该模式包含的语音帧总数,R(m)为第m帧的语音LPC倒谱特征矢量。所要识别的一个输入词条语音称为测试模板,可表示为T={T (1), T(2),…, T(n),…, T (N)},n为测试语音帧标号,模式中共包含N帧语音,T(n)为第n帧的LPC倒谱特征矢量。

比较参考模板和测试模板的相似度,可以计算它们的距离D[T,R],距离越小则相似度越高。语音中各个段落在不同情况下的持续时间会产生或长或短的变化,大多数情况下测试模板和参考模板长度不相等N≠M,因此采用动态规整(DP)的方法。

DTW算法的实现为:分配两个N×M矩阵,分别为累积距离矩阵D和帧匹配距离矩阵d,其中帧匹配距离矩阵d(i,j)的值为测试模板的第i帧与参考模板的第j帧间的距离。算法分为两步:先要计算参考模板的所有帧和未知模板的所有帧之间的相互距离,结果存在矩阵d中;然后根据判断函数计算累积距离矩阵D,D(N,M)即为最佳匹配路径所对应的匹配距离。DTW算法约束端点条件为:起点(1,1),终点(n,m),n和m分别为测试和参考语音模板的帧序列长度。

3.3.2 应用中提高识别率的改进方法

在应用中,提高DTW识别率的办法有冗余模板法、松弛起点终点法、改进局部路径约束函数法等。

(1)冗余模板法。采用每个词条多套模板的方法,可以改进其识别效果。在实验中,采用在语音训练阶段,每个词条训练四次,即每个词条提取出4个参考模板,这样,只要测试模板与4个参考模板中的一个匹配成功,匹配结果就是正确的,这样便大大提高了识别率。

(2)松弛起点终点法。将匹配过程中的固定起点(终点)改为松弛起点(终点)。端点对齐的限制条件提高了对语音端点检测的精度要求。路径不再是从(1,1)点出发,可以从(n,m)=(1,2)或(2,1),或(1,3)或(3,1)…点出发,称为松弛起点。同样,路径也不必在(N,M)点结束,可在(n,m)=(N,M-1)或(N-1,M)或(N,M-2)或(N-2,M)点…结束,称为松弛终点。松弛起点终点的优点是可克服由于端点检测不精确造成测试模板和参考模板起点终点不能严格对齐的问题[6]。

(3)改变局部路径约束函数法。不同的连续性条件导致了不同的路径,局部路径约束函数不一样,DTW识别效果就会不同。可以对局部约束路径进行加权处理,提高识别率。

8.jpg

本文中采用的模板匹配算法就是融合这三种改进技术后的动态规整算法,称之为ADTW算法。对这种算法进行了实验,得到该算法的实际识别率,并对之进行分析。



评论


相关推荐

技术专区

关闭