新闻中心

EEPW首页 > 消费电子 > 设计应用 > 基于DTW的编码域说话人识别研究

基于DTW的编码域说话人识别研究

作者：时间：2010-10-14 来源：网络

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

收藏

　本文选择G.729编码帧中第一子帧的LSP(1)参数的反余弦LSF及由其转换得到的LPC、LPCC参数作为声道特征参数。
　参考文献[1]发现识别特征加入G.729压缩帧中的语音增益参数，说话人识别性能发生了下降。去除G.729压缩码流特征中的增益参数GA1、GB1、GA2、GB2，结果发现，当采用了去除增益参数的特征矢量方案X=(L0,L1,L2,L3,P1,P0,P2)，识别性能得到了提高，所以本文最终采用的G.729压缩码流特征为X=(L0,L1,L2,L3,P1,P0,P2)，共7维。
2 动态时间规整(DTW)识别算法
　动态时间规整DTW(Dynamic Time Warping)是把时间规整和距离测度计算结合起来的一种非线性规整技术。该算法基于动态规划思想，解决了发音长短不一的模版匹配问题。
　算法原理：假设测试语音和参考语音分别用R和T表示，为了比较它们之间的相似度，可以计算它们之间的距离D[T，R]，距离越小则相似度越高。具体实现中，先对语音进行预处理，再把R和T按相同时间间隔划分成帧系列：

然后采用动态规划进行识别。如图2所示。

本文引用地址：https://www.eepw.com.cn/article/166450.htm

把测试模版的各个帧号n＝1,…,N在一个二维直角坐标系的横轴上标出，把参考模版的各帧号m＝1,…,M在纵轴上标出，通过这些表示帧号的整数坐标画出的横纵线即可形成一个网格，网格中的每一个交叉点(n，m)表示测试模版中某一帧与训练模版中某一帧的交叉点。动态规划算法可以归结为寻找一条通过此网格中若干格点的路径，路径通过的格点即为测试和参考模版中距离计算的帧号。

　整个算法主要归结为计算测试帧和参考帧间的相似度及所选路径的矢量距离累加。
　识别流程如图3所示。

上一页 1 2 3 下一页

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词： 编解码器 音频

评论

相关推荐

音频均衡器电路

嵌入式系统音频均衡 | 2023-08-08

红外音频链接电路

手机与无线通信红外音频无线传输 | 2023-08-07

请问目前常用的音频/语音录音采集模块?

C-- | 2004-07-01

报告预测：07年音频芯片市场收入达68亿美元

hpnet | 2003-05-09

远程操作机器人电路

嵌入式系统遥控机器人音频视频射频 | 2023-08-09

音频电路图

资源下载运算放大器音频前置放大 | 2007-02-09

双路SCART连接器的音频_视频开关 MAX4397

资源下载 Maxim 音频/视频开关 MAX4397 | 2007-03-20

电视发射器电路

嵌入式系统音频视频传输 VHF | 2023-07-21

AMD 助力千视电子 NDI 和 NDI|HX 编解码解决方案

嵌入式系统 AMD Zynq UltraScale MPSoC NDI 编解码器 | 2024-02-29

有源音频交叉电路

嵌入式系统音频交叉 | 2023-08-04

集成音频功率放大电路LM380

设计方案集成音频功率放大电路 LM380 | 2009-07-06

音频控制电路集锦

资源下载音频控制电路 | 2007-12-25

计算机音频工作站总论--音频工作站与硬盘录音机同类比较(转载）

hpnet | 2002-05-15

请教s3c241上音频问题?

ycl39 | 2004-11-27

音频音控制电路

嵌入式系统音频控制电路 | 2023-08-07

敏迪内置音频解码/编码器的蓝牙基频LSI

yongzhe | 2005-09-01

音频无线传输-红外发射电路

资源下载音频无线传输红外发射电路 | 2007-12-25

Snapdragon Sound 骁龙畅听技术：“声”临其境畅享无线好声音

消费电子音频 Snapdragon | 2025-03-14

BA5204/5204F 3V双声道音频功率放大器的典型应用电路

设计方案 BA5204 5204F 声道音频功率放大器典型应用 | 2009-07-06

Ceva与联发科携手升华身临其境的空间音频移动娱乐体验

消费电子 Ceva 联发科空间音频移动娱乐音频 | 2025-01-09

AN7113S音频功率放大电路

设计方案 AN7113S 音频功率放大电路 | 2009-07-06

AN102S双声道音频功率放大器的典型应用电路

设计方案 AN102S 声道音频功率放大器典型应用电路 | 2009-07-06

YD2206 双声道音频功率放大电路

资源下载音频功率放大放大电路 YD2206 | 2007-12-25

AN7100S双声道音频功率放大电路

设计方案 AN7100S 声道音频功率放大电路 | 2009-07-06

Snapdragon Sound骁龙畅听技术助力全新Bose SoundLink Max手提音箱带来“派对级”音频体验

消费电子 Snapdragon Sound 骁龙畅听 Bose SoundLink Max 手提音箱派对级音频 | 2024-05-31

焦点

推荐视频

技术专区

关闭