新闻中心

EEPW首页 > 消费电子 > 设计应用 > AI驱动的耳机通过语音克隆和3D空间音频提供群组翻译

AI驱动的耳机通过语音克隆和3D空间音频提供群组翻译

作者：时间：2025-05-13 来源：Tech Xplore

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

收藏

华盛顿大学（University of Washington）的博士生陈拓超（Tuochao Chen）最近参观了墨西哥的一家博物馆。陈不会说西班牙语，所以他在手机上运行了一个翻译应用程序，并将麦克风对准导游。但即使在博物馆相对安静的地方，周围的噪音也太大了。由此产生的文本毫无用处。

最近出现了各种技术，有望实现流畅的翻译，但这些都没有解决陈的公共空间问题。例如，Meta 的新眼镜只能与隔离扬声器一起使用;他们会在说话人完成后播放自动语音翻译。

现在，Chen 和威斯康星大学的一组研究人员设计了一种耳机系统，可以同时翻译多个扬声器，同时保留人们声音的方向和质量。该团队构建了这个名为 Spatial Speech Translation 的系统，并使用装有麦克风的现成降噪耳机。该团队的算法将空间中的不同说话者分开，并在他们移动时跟随他们，翻译他们的语音，并以 2-4 秒的延迟播放。

华盛顿大学的研究人员设计了一种耳机系统，可以同时翻译几个人说话，跟随他们的移动并保留他们声音的方向和质量。该团队构建了这个名为 Spatial Speech Translation 的系统，并使用配有麦克风的现成降噪耳机。图片来源：Chen et al./CHI '25
该团队于 4 月 30 日在日本横滨举行的 ACM CHI 计算系统中的人为因素会议上展示了他们的研究。概念验证设备的代码可供其他人构建。“其他翻译技术是建立在只有一个人在说话的假设之上的，”资深作者、华盛顿大学计算机科学与工程学院的教授Shyam Gollakota说。“但在现实世界中，你不能只有一个机器人声音为一个房间里的多人说话。我们第一次保留了每个人的声音及其来源。

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词： AI 耳机 语音克隆 3D空间音频

评论

相关推荐

AI PC新突破端侧首次支持128K上下文窗口实现2.2倍推理优化

智能计算 AI PC 推理优化面壁英特尔 | 2025-06-09

HIFI耳机基础知识入门

资源下载动圈（Dynamic）静电（Electrostatic）耳机阻抗 | 2007-05-29

AI网络架构或将进入“无交换机”时代

AI 网络架构交换机 | 2025-06-12

ECC82电子管OT L耳机放大器

设计方案 ECC82 电子管耳机放大器 | 2009-07-06

AI可以以人类的方式学习语言

智能计算 AI 学习语言 | 2025-06-03

安富利带OLED显示屏的头戴式耳机方案

资源下载 MOD688BGB-OLED 蓝牙耳机 | 2007-10-31

英伟达CSO：美国AI禁令让中国抢走大量AI研发人才

英伟达 AI | 2025-06-10

请教：耳机放大器选型及应用(简单的）

vivi_akmi | 2005-01-13

超级广场效果的耳机放大器电路

设计方案超级广场效果耳机放大器 | 2009-07-06

使用生成式人工智能创建硬件原型

智能计算 AI 智能计算硬件设计 | 2025-06-03

小米汽车业务亏损收窄，预计下半年实现盈利

小米智能电动汽车 AI YU7 辅助驾驶 | 2025-06-05

人工智能可以像人类一样学习语言

智能计算 AI 智能计算， | 2025-06-03

请教：简单的耳机放大器选型及应用

vivi_akmi | 2005-01-13

意法半导体推节省空间的立体声耳机放大器

hpnet | 2003-07-26

蓝牙无线耳机设计及VxWorks移植方法

资源下载蓝牙耳机 I2S总线 VxWorks | 2007-10-31

CSR蓝牙芯片采用DSP技术提高Jabra耳机性能

pingdea | 2005-10-22

台积电2nm良率曝光

台积电 2nm AI 苹果晶圆 | 2025-06-05

普林斯顿大学用AI进行无线芯片设计

智能计算 AI 无线芯片设计 | 2025-06-05

初创公司的模拟AI承诺为PC提供强大功能

智能计算 EnCharge AI 电容半导体元件模拟AI | 2025-06-03

一款性能极佳的JFET-MOSFET耳机功放

设计方案一款性能极佳 JFET-MOSFET 耳机功放 | 2009-07-06

LC-KING 耳机放大电路

设计方案 LC-KING 耳机放大 | 2009-07-06

用OPA2604等双运放做的耳机功放电路

设计方案 OPA2604 双运放做耳机功放 | 2009-07-06

高频红外线调谐立体声耳机电路

资源下载耳机红外线调谐立体声高频 | 2008-01-08

MP3元件开关，耳机插座，更多更支持开发。

更多电子 | 2005-09-08

iCAN-4017 AI功能模块

资源下载周立功单片机功能模块 iCAN-4017 AI | 2007-03-30

焦点

推荐视频

技术专区

关闭