新闻中心

EEPW首页 > 消费电子 > 业界动态 > Nuance语音识别技术

Nuance语音识别技术

作者:时间:2015-01-19来源:网络收藏

  1.概述

本文引用地址:http://www.eepw.com.cn/article/268339.htm

  技术,Automatic Speech Recognition,简称ASR,是一种让机器听懂人类语言的技术。语言是人类进行信息交流的最主要、最长用、最直接的方式。技术是实现人机对话的一项重大突破,在国外近年来发展十分迅速,其应用也逐步得到推广。近几年逐渐普及的IVR(自动电话应答)处理了不少简单而又重复的咨询工作,节省了不少人力,但这种按键式的语音自动应答却让客户花费很多时间按指引来完成简单的查询,令用户倍感不便。

  语音识别无疑可以解决该方面的问题。语音识别系统的开发成功,充分发挥了计算机技术和网络技术的优势,采用先进的人机对话方式,摆脱电话按键的束缚,人们只要象平常一样对着电话简单的说出所需服务项目,即可轻松获取自动系统提供的所需信息。

  

 

  语音识别系统结构

  2.语音识别应用

  公司是自然语音接口软件的佼佼者。使用自然语音接口软件,人们可以通过电话方便安全地获取信息、服务并进行交易。每天,千千万万的人通过拨打运行公司语音识别、语言理解和声纹鉴别软件的电话,进行出游预订、股票交易、与其它通讯媒体、企业和互联网系统进行交往等活动。NUANCE的应用:美国航空、Bell Atlantic、Charles Schwab、家庭购物网络、Lloyds TSB、Sears、UPS.

  3.NUANCE语音识别特点

  (1)海量词汇、独立于讲话者的健壮识别功能

  系统能可靠地对多种语言进行大词汇量的识别,并可提供识别结果的置信度。该系统对商业上使用的大量词汇提供最准确的语音识别技术。利用Nuance系统开发的应用程序,在市场上具有最高的准确率。生产中的应用程序经测试,准确性超过96%.

  (2)基于主机的客户/服务机结构

  Nuance系统基于开放式客户/服务机结构,特别为大型应用程序所需的健壮性和可伸缩性而设计。呼叫者的讲话由客户端收集,而识别和鉴别处理的负载被平均分配到网络上的多个分开的服务器上。

  (3)N-Best处理

  对于有些应用程序,可能需要识别引擎产生可能的识别结果集,而不是一个最好的结果。Nuance系统的N-best识别处理方法便有这个功能,它提供了可能的识别结果列表,并按可能性从高到低排列。

  (4)语法概率

  Nuance系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定。当被讲的词语或短语的概率可根据实际使用进行估计时,非常有用。对语法增加概率可提高识别的准确率和速度。

  (5)降低噪音

  当进来的呼叫包含稳定的背景噪音时,Nuance系统通过一种机制,使识别服务器更准确地进行识别。识别服务器将进来的话语进行增强,以有效地将语气、嗡嗡声、哼叫声、嘘嘘声等噪声过滤。如果相当数量的电话均含有稳定的背景噪声,比如在汽车上免提打电话时,这个机制效果较理想。


上一页 1 2 下一页

关键词: Nuance 语音识别

评论


相关推荐

技术专区

关闭