新闻中心

EEPW首页 > 智能计算 > 业界动态 > 深度:语音技术革命正在改变人类的交流方式

深度:语音技术革命正在改变人类的交流方式

作者:时间:2018-11-12来源:网络收藏
编者按:无论是在医疗、旅游、还是商业活动,以人工智能为代表的新技术正在彻底改变人与人之间的交流方式,并将打破身体、地域、国别、语种的各种限制。未来,我们的交流对象也将不再局限在人类,可以是机器、可以是动物。

  MyTalkTools Mobile是由一位父亲开发的,以帮助他儿子克服通信困难,他的儿子出生时患有Nager综合症,这是一种影响听力、言语和其他能力的罕见疾病。目前该软件已拥有超过10万名用户。

本文引用地址:http://www.eepw.com.cn/article/201811/394166.htm

  2017年初,微软推出了GazeSpeak应用程序,帮助肌萎缩性侧索硬化(ALS)患者用眼球运动进行沟通。该应用通过手机摄像头跟踪患者的眼睛运动,并用AI进行字词预测。

  2)语音生成设备

  、自然语言处理和文本预测技术极大地推动辅助通信技术的发展,语音合成应用可以为用户提供定制化、个性化的服务。

  语音生成设备可以将单词或图片转化成语音,比辅助应用APP更加先进。某些产品允许用户可以从几种不同的声音中进行选择,例如男性或女性,儿童或成人,甚至可以选择一些地域口音。某些算法模型可以追踪患者眼睛运动或头部运动来进行词汇选择,并合成语音。

  Pocket Go Talk是一款可穿戴的小型便携式AAC设备,也可以在桌面使用,具有五种可调节的扫描速度。通过5个易操作的按钮生成25条语音消息,每条语音可以长达12秒。


深度:语音技术革命正在改变人类的交流方式


  便携式辅助书写平板MegaBee是在英国斯托克曼德维尔医院的闭锁综合征患者的帮助下研发出来的。通过眼球运动和闪烁作为选择字母或短语的方法,然后在屏幕上显示,从而帮助中风、多发性硬化症、运动神经元疾病患者及其它语言障碍患者进行交流。


深度:语音技术革命正在改变人类的交流方式


  还有很多新兴科技公司正在利用机器人技术提升患者的社交能力。卢森堡机器人公司LuxAI推出适用于自闭症儿童的社交机器人QTrobot,实验证明,该机器人可以明显增加自闭症儿童的注意力和参与度,同时减少他们的焦虑和破坏行为。

  美国波士顿公司VocalID利用众包和语音混合技术为语言障碍患者提供个性化的合成语音。目前已有110多个国家的超过14000人为公司的语音库The Human Voicebank提供了600多万句话。

  2017年,谷歌宣布神经网络模型WaveNet正式商用于Google Assistant中,比初始模型效率提高了1000倍,可以更好地模拟自然语音。该模型可以根据真实的人类语音对音频波形进行建模分析,从中学习并创建自己的声音。

  3)代表未来的脑机接口

  意念交流是很多科幻小说和电影里的场景,而现在科研人员正在通过脑机接口技术将之变成现实。

  早在1998年,英国雷丁大学的研究员Kevin Warwick博士在自己的手臂上植入一个发射器来控制门和其它装置。2002年,他将电极接入自己的神经系统,以便用思维控制轮椅,并允许远程机器人手臂模仿他的手臂动作。

  Warwick博士的目标是帮助语言障碍患者进行沟通,他将一个芯片植入他妻子的手臂,通过互联网将两人的大脑联系在一起,创造了世界上第一个脑—脑电子通信。


深度:语音技术革命正在改变人类的交流方式


  2012年,美国因中风而瘫痪的患者Cathy Hutchinson利用脑植入芯片成功的用思维控制机器手臂端起一杯咖啡,并和吸管中喝了一口。

  2014年初,法国公司Axilum Robotics与西班牙巴塞罗那大学、Starlab公司和哈佛医学院一起进行第一次脑对脑的沟通,在5000公里外,实现了直接在两个人的大脑之间进行沟通。

  2016年埃隆·马斯克成立了Neuralink公司进行脑机接口研究,以帮助治疗人类的脑部疾病。

  2018年5月,俄罗斯新西伯利亚国立技术大学声称研制出了一款用意念控制的越野轮椅。颈部以下瘫痪者可乘坐该轮椅在室内甚至城市街道上独立行动。

  2018年6月,美国麻省理工学院下属计算机科学与人工智能实验室(CSAIL)的研究人员开发了一种新界面系统,它可以读取人类操作人员的脑电波,通过思维命令机器执行任务。

  目前脑控科技已经成为各国科研人员竞相研究的前沿课题。尽管大多数研究目前还停留在实验室阶段,一旦该技术成功商业化,瘫痪者、语言障碍者、盲人等群体将迎来生命中的第二个春天。

  语音2.0:语音界面技术和实时翻译

  未来,科技创新将使人类的交流与沟通提升到另外一个层次,它不仅仅是帮助语言障碍患者进行无障碍交流;还会在人与人或人与机器之间进行信息交换。

  由于人类语言的多样化,限制了人与人之间的沟通,特别是跨国别和跨语种的交流。近几年,随着实时翻译技术的成熟,语言鸿沟正被慢慢地消除。


深度:语音技术革命正在改变人类的交流方式


  2017年10月,谷歌推出Pixel Buds蓝牙耳机,使用Pixel智能手机即可在40种不同语言之间进行即时翻译。

  微软的Skype Translator可以对语音、视频及50种语言的文本内容实现八种语言之间的实时翻译

  各种便携式翻译设备可以帮助游客在几秒钟内进行语言翻译。未来,小小的耳机设备将打破出行的语言限制,而传统的翻译这一职业也将被新技术所替代。

  在语言的新技术革命中,手语也正在被技术所替代。2015年,美国德克萨斯A&M大学开发了一款可穿戴设备,通过感知用户的手臂动作,将手语翻译成英语。该设备可以识别出大约40个美国标准手语动作,准确率达到了96%。

  利益于人工智能技术的飞速发展,机器不仅仅是充当翻译人员,还可以成为沟通伙伴。据Gartner预测,到今年年底,我们与新技术的互动中有30%将通过与智能机器完成。目前每六个美国成年人中,就有一个拥有智能音箱或相关设备。除了控制智能家居外,亚马逊的AI助手Alexa已经可以帮助用户在线购物。未来AI助手将能实现更多的功能。

  无论是在医疗、旅游、还是商业活动,以人工智能为代表的新技术正在彻底改变人与人之间的交流方式,并将打破身体、地域、国别、语种的各种限制。未来,我们的交流对象也将不再局限在人类,可以是机器、可以是动物。

  这一切都是科技带来的福利。科技,本该如此。


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭