新闻中心

EEPW首页 > 智能计算 > 业界动态 > 谷歌开源AI能区分声音准确率达92%

谷歌开源AI能区分声音准确率达92%

作者：时间：2018-11-15 来源：网易科技

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

收藏

　　据VentureBeat报道，在语音嘈杂的环境中，要想分辨出有几个人讲话、在什么时间讲话，对于机器来说非常困难。但谷歌人工智能(AI)研究部门在语音识别方面取得了新进展，能以92%的准确率识别出每个人声音的专属模式。

　　谷歌 AI研究部门在最新名为《Fully Supervised Speaker Diarization》的论文和相关博客文章中，研究人员描述了一种新的AI系统，它“能以一种更有效的方式识别声音”。

　　这套系统涉及到Speaker diarization任务，即需要标注出“谁”从“什么时候”到“什么时候”在说话，将语音样本分割成独特的、同构片段的过程。强大的AI系统必须能够将新的演讲者发音与它以前从未遇到过的语音片段关联起来。

　　这篇论文的作者声称，核心算法已经可在Github上的开源软件中可用，它实现了一个在线二值化错误率(DER)，在NIST SRE 2000 CALLHOME基准上是7.6%，这对于实时应用来说已经足够低了，而谷歌之前使用的方法DER为8.8%。

　　谷歌研究人员的新方法是通过递归神经网络(RNN)模拟演讲者的嵌入(如词汇和短语的数学表示)，递归神经网络是一种机器学习模型，它可以利用内部状态来处理输入序列。每个演讲者都从自己的RNN实例开始，该实例不断更新给定新嵌入的RNN状态，使系统能够学习发言者共享的高级知识。

　　研究人员在论文中写道:“由于该系统的所有组件都可以在监督环境下学习，所以在有高质量时间标记演讲者标签训练数据的情况下，它比无监督系统更受青睐。我们的系统受到全面监督，能够从带有时间戳的演讲者标签例子中学习。”

　　在未来的工作中，研究团队计划改进模型，使其能够集成上下文信息来执行脱机解码，他们希望这将进一步减少DER。研究人员还希望能够直接对声学特征进行建模，这样整个Speaker diarization系统就可以进行端到端训练。

关键词：谷歌 AI

评论

相关推荐

突破傳統手機應用框架　Google平台讓溝通更傳神

资源下载突破傳統手機應用框架谷歌平台讓溝通更傳神 | 2013-09-22

最新全球生成式AI消费应用榜单Top 100

生成式 AI | 2025-09-02

什么时候应该使用RAG、TAG和RAFT AI？

智能计算 RAG TAG RAFT AI | 2025-09-14

基于VisitionX制造智能眼镜

设计方案 AI 智能眼镜 VisitionX | 2025-08-12

AI 采用率在大型公司中下降

智能计算 AI 智能计算 | 2025-09-09

蓄谋已久的谷歌与居安思危的百度

wxy_88kl | 2008-04-25

尼吉康的事业介绍

视频 nichicon 尼吉康汽车电子 IoT AI | 2025-07-25

谷歌行政总厨跳槽Facebook

wxy_88kl | 2008-04-08

联发科天玑9500参数：4.21GHz CPU、100 TOPS AI

手机与无线通信联发科天玑9500 CPU AI | 2025-09-09

谷歌中国喊冤称互联网地图无法可依

felixwoo | 2008-05-08

谷歌推出Friend Connect 提供共享社交服务

wxy_88kl | 2008-05-14

满足AI需求的关键本地生态系统：台积电

智能计算 AI 本地生态系统台积电 | 2025-09-14

SDN面临的非技术性挑战

设计方案 SDN 谷歌电信运营商投资回报率 | 2015-07-28

谷歌正拉拢小型云服务提供商托管 TPU，目标直指英伟达

智能计算谷歌 TPU 芯片 AI | 2025-09-04

WTC-AI型太阳能热水器电路图

设计方案电子电路图，WTC-AI 太阳能热水器电路热水器 | 2012-07-30

IT企业CEO薪水揭秘 IBM居高惠普谷歌有点冤

wxy_88kl | 2008-04-28

Gartner：到2025年末，AI PC将占全球PC市场份额的31%

智能计算 Gartner AI PC | 2025-09-09

在重大反垄断裁决中，谷歌可以保留 Chrome 和 Android，但仍面临较轻的处罚

手机与无线通信反垄断谷歌 Chrome Android | 2025-09-03

万家乐JSYZ5-AI燃气热水器电路图

设计方案电路图热水器燃气 JSYZ5-AI 万家乐 | 2013-01-17

电子元件培训教材

资源下载 NBA 电子元件识别电阻识别电容识别 AI MI SMT DIP 静电防护 | 2008-09-20

WTC-AI太阳能热水器电路图

设计方案 WTC-AI 太阳能热水器电路图 | 2012-07-24

iCAN-4017 AI功能模块

资源下载周立功单片机功能模块 iCAN-4017 AI | 2007-03-30

南芯科技强势入局\"多相电源\"市场，提供更高效的\"AI+通用电源\"方案

电源与新能源南芯科技多相电源 AI+通用电源 | 2025-09-02

谷歌Google Android娛樂安全功能創新意

资源下载谷歌 Google Android 娛樂安全功能創新 | 2013-09-22

谷歌的電子書市場策略：隨時可讀之雲端閱讀

资源下载谷歌的電子書市場策略 | 2013-09-22

美国或将再立AI GAIN法案，要求本国AI芯片制造商向海外供货前先满足国内需求

AI 芯片英伟达 | 2025-09-11

焦点

推荐视频

技术专区

关闭