新闻中心

EEPW首页 > 消费电子 > 业界动态 > 科大讯飞的人工智能之路

科大讯飞的人工智能之路

作者:时间:2016-11-02来源:互联网经济圈收藏
编者按:科大讯飞是一家典型的创业公司,身上还有一个特殊的标签:中国在校大学生创业的第一家上市公司。

  今年,李世石与Alpha Go的人机围棋大战吸睛无数,的话题始料未及地席卷了世界每处。今年也恰逢学科诞生一甲子,历经波折的发展终于掀起全球热潮,各国政府纷纷提出人工智能发展研究相关计划,苹果、谷歌等国际IT产业巨头也相继推出一系列人工智能应用,希望在新一轮人工智能技术竞争中取得先机。

本文引用地址:http://www.eepw.com.cn/article/201611/339519.htm

  作为亚太地区最大的智能语音和人工智能上市公司,也是中国智能语音与人工智能产业的领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先成果。目前,已经占有中文语音技术市场70%以上的市场份额。

  在人工智能技术钻研与产业布局上,也较早提出了明确的思路与方向。2014年,“讯飞超脑”计划应运而生,目标是让机器实现从“能听会说”到“能理解会思考”;2015年,科大讯飞发布的具有里程碑意义的人机交互界面AIUI现在聚合了超过18万的开发伙伴和8亿的终端用户,以科大讯飞为中心的人工智能产业生态已经逐步构建。科大讯飞力求在人工智能时代真正到来时全面开花,抢占人工智能产业高点。

  科大讯飞是如何发展的?

  1999年,还在中国科学技术大学就读的刘庆峰面对当时中文语音市场由国际巨头把持的现状,怀揣“中文语音技术必须由中国人做到全球最好,中文语音产业必须掌握在自己手上”的信念,毅然创立了科大讯飞。

  从6个人的团队到后来18个人创业,一度并没有人相信这个“草台班子”能够与国际巨头抗衡。初期的科大讯飞遭逢创业的种种艰难,直至5年后,公司才终于实现盈亏平衡。在盈利的博弈与权衡中,语音技术与产业当时被牢牢确立为公司的发展目标和方向。巨大的压力之下,磨砺出的是坚持创新和坚忍不拔的宝贵品质,这也成为科大讯飞一贯坚守和传承的核心精神。

  创立近10年后,科大讯飞迎来了一个发展拐点:上市。2008年的中国风云变幻,科大讯飞上市犹如浪潮中的一簇小水花,却激起了自身的滔天巨浪。技术仍然是核心,产品和市场意识逐渐走上舞台。刘庆峰带领团队进一步梳理了公司的愿景和使命,立志要让事业影响中国未来,影响到每一个普通人的生活中。

  功夫不负有心人。凭借核心技术的绝对优势,科大讯飞在历次的国内外语音合成评测中,各项关键指标均名列第一,2008年至今连续在国际语种识别评测大赛中名列前茅,2003年和2011年两次荣获“国家科技进步奖”,2005年和2011年两次获得中国信息产业自主创新最高荣誉“信息产业重大技术发明奖”。

  2010年,科大讯飞发布了语音云平台和输入法,云平台面向所有创业者免费开放,为海量用户提供服务。数据的抓取、资源的整合,显示的是科大讯飞决策未来的战略决心。在此基础上,随着人工智能时代的来临,科大讯飞连续发力:2014年发布“讯飞超脑”计划,核心就是让机器从“能听会说”到“能理解会思考”;2015年发布对人工智能产业具有里程碑意义的人机交互界面——AIUI。在教育、家居、客服、车载、医疗等细分领域,科大讯飞依托人工智能技术达成广泛合作,推出品类丰富的产品体系覆盖市场。

  2016年5月,ResearchMarkets最新发布的报告称在全球语音市场,谷歌、微软、苹果和科大讯飞获得了迅速增长,全球市场份额分别为20.7%、13.4%、12.9%和6.7%,科大讯飞已经代表中国民族创新企业站上了国际舞台,在全球竞争中占据一席之地。放眼未来,科大讯飞将继续推动万物互联,并推动整个IT产业第六次浪潮的到来。

  “讯飞超脑”——科大讯飞的人工智能布局

  美国、欧盟等发达国家分别提出了“Brain Initiative”和“Human Brain Project”等人脑研究计划,投入巨资并将其提升到与“人类基因图谱”重大工程并重的高度。苹果、谷歌等国际IT产业巨头亦相继推出了Siri、Google Now语音搜索等一系列人工智能应用。全球政府、企业都已将目光投向人工智能行业,各显神通。

  人工智能的突破与“认知革命”紧密相关。七万年前,人类发生了“认知革命”,核心是智人拥有丰富的语言,可以更好的描述自然世界、执行更加复杂的计划,关键是可以描述梦中和想象的东西,从而产生虚构、宗教和各种概念。正因如此,目前很多正在做人工智能研究的专家,包括Michael Jordan和Yann Lecun等都已经意识到,自然语言理解对于人工智能来说是一个突破口。

  科大讯飞目前正在执行的“讯飞超脑计划”,就是希望实现包括感知智能和认知智能在内的全面突破,也是在人工智能领域的核心布局内容。在感知智能领域,语音识别、手写识别方面每年保证30%-50%的错误率的下降;在识别普通话的基础之上,进一步识别方言;不仅能够理解人类和机器的对话,还能理解人和人之间的对话;不仅能够识别联机手写的字符,还能识别离线手写的字符。在认知智能上的研究目标,关键是让机器能理解会思考,这必须要突破语言理解、知识表示、联想推理,自主学习等多个方面。



  目前,科大讯飞的“讯飞超脑”已取得了阶段性的进展。作为计划的重要组成部分,科大讯飞正牵头进行国家科技部863重大专项——“类人答题机器人项目”,未来要让机器人参加高考并考上一本,甚至是清华、北大、科大这样水平的高校。而在口语翻译和评测方面,目前科大讯飞口语翻译技术已达到英语六级水平,在国际机器翻译评测(IWSLT2014,NIST2015)等大赛中夺得冠军,口语作文评测机器已可替代老师进行自动评测,在广东高考英语口语作文考试中得以全面应用。在主观题阅卷上,科大讯飞将业界独家的人工智能核心技术应用于考试以及传统线下作业的自动批阅,不论是手写识别的还是选择题涂抹,都可以先通过OCR转变成计算机可以理解的文本和图像,再让计算机自动对答案的正确程度进行评判,这其实是感知智能和认知智能的结合。现在安徽省合肥市和安庆市的会考中,英文和中文的考试已经全部使用了整套感知智能和认知智能技术进行自动评分,取得了非常好的效果,以后此技术将会被全面推广到包括文科和理科的所有课程。

  在产品应用之外,基于多年积累,目前科大讯飞在各项大赛中都取得了优异的成果。以今年为例,在年初举行的国际语音合成大赛上,科大讯飞通过承建的语音及语言信息处理国家工程实验室报送的参赛系统,不仅继续在自然度、相似度、可懂度等传统指标上保持国际领先,还在语篇段落表现测试中所有7项测试指标位列第一。这是科大讯飞自2006年首次参赛以来,第十一次参与该项赛事,持续巩固了在智能语音技术的全球领先地位。

  随后,在今年的全球人工智能比赛Winograd Schema Challenge中,科大讯飞再次荣获第一。Winograd Schema Challenge作为意图取代图灵测试(Turingtest)的人工智能测试项目,着重考察认知、推理和常识判断能力。

  此外在美国当地时间9月13日,科大讯飞领衔的中国技术团队又在国际多通道语音分离和识别大赛(CHiME)中包揽了赛事全部三个项目的冠军。据介绍,CHiME比赛重点解决的是真实、复杂场景下的语音识别,因此是语音识别领域最高难度的比赛之一。参赛的各个语音系统需要克服高噪声、混响等干扰,在咖啡厅、公交车、街道等日常生活场景中,准确地识别和处理英文语音。

  以各项赛事成绩名列前茅的技术为保障,“讯飞超脑计划”的目标就是让各类智能终端实现从“能听会说”到“能理解会思考”的演进,进而实现全球第一个中文认知智能计算引擎,在语音合成、识别和人工智能等各项领域引领智能应用潮流的发展。


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭