基于中英文数字语音登陆系统的仿真研究

作者：李梓钰,林子明,程晓东,杨洁时间：2012-06-27 来源：电子产品世界

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

　　摘要：为了方便学生使用中文或英文说出学号与名字登录注册系统，设计了中英文数字语音登录系统。采用MFCC(Mel频率倒谱系数)作为语音特征参数，在隐马尔可夫模型HMM(Hidden Markov Model)框架下建立了基于语音识别开发工具包HTK的中英文连续数字语音识别系统，包括对语音信号的预处理、特征参数的提取，识别模版的训练，最后送到识别器进行识别。通过建立中文、英文和中英文混合训练集和测试集声学模型，并得到了较高的识别率，从而加强多媒体注册系统的稳定性和鲁棒性。

本文引用地址：https://www.eepw.com.cn/article/134004.htm

　　引言

　　语言是人与人之间在日常交往中最直接也是最强大的工具，然而我们并不满足于人与人之间的对话，而是通过语音识别技术来实现人机对话，语音识别技术的终极目标就是能够让人类与计算机进行自由地交谈。随着语音识别技术的逐渐成熟及近些年来已经取得的进步，英文数字语音识别在其发展的20多年间已达到了很高的识别率，汉语数字语音识别也经过多年研究在PC平台和实验室条件下达到了高性能，但中英文混合连续数字语音识别还有待进一步研究，张晴晴等人研究的中英双语混合语音识别的识别率为16.8%，远低于理想中的识别率。为使识别效果达到可实用的水平，本系统首先从基本的中英文数字语音识别出发，从而为相应的登录注册系统做出一些尝试。

　　本文研究的中英文连续数字语音识别，包含中文0-10和英文zero-ten的数字语音识别，其中包括对语音信号的预处理、特征参数提取、中英文声学模型与语言模型的训练及模版匹配等，适合于研究数字语音登录系统，比如用户用中英文任何语言念学号或是身份证号就能登陆，免去书写的麻烦，同时也对后续研究中英文混合连续语音识别奠定了基础。

　　语音识别原理

　　根据对说话人说话方式的要求，语音识别可以分为孤立字(词)语音识别系统，连接字语音识别系统以及连续语音识别系统;根据对说话人的依赖程度，语音识别可以分为特定人和非特定人语音识别系统;根据词汇量大小，又可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量的语音识别系统。不同的语音识别系统，其目的和功能各不相同，但它们所采用的基本框架大体一致，语音识别基本流程如图1。