专栏中心

EEPW首页 > 专栏 > 用语言建模世界:UC伯克利多模态世界模型利用语言预测未来(2)

用语言建模世界:UC伯克利多模态世界模型利用语言预测未来(2)

发布人:机器之心 时间:2023-08-07 来源:工程师 发布文章
HomeGrid 中的语言提示


研究者引入了 HomeGrid 来评估一个环境中的智能体。在这个环境中,智能体除了任务指令外还会收到语言提示。
HomeGrid 是一个具有指令和多样化提示的具有挑战性的视觉网格世界。HomeGrid 中的提示模拟了智能体可能从人类那里学到或从文本中获取的知识,提供了对解决任务有帮助但不是必需的信息:
未来观察:描述了智能体未来可能观察到的情况,比如「盘子在厨房里」。

图片


Correction:提供了基于智能体当前行为的交互式反馈,比如「转身」。
图片
Dynamics:描述了环境的动态变化,比如「踩踏板打开垃圾桶」。

图片


HomeGrid 环境将与代码一起发布,以鼓励大家进一步在这个方向上进行研究。
尽管智能体没有明确地接受有关文本对应于什么观察结果的明确监督,但 Dynalang 通过未来预测目标学会了将各种类型的语言与环境相联系。Dynalang 的性能优于基于语言的 IMPALA 和 R2D2,这两种方法在使用不同类型的语言上遇到困难,通常在超出指令范围的语言任务上表现更差。
图片
Messenger 中的游戏手册
研究者在 Messenger 游戏环境中进行评估,以测试智能体如何从更长、更复杂的文本中学习,这需要对文本和视觉观察进行多次推理。智能体必须对描述每个任务动态的文本手册进行推理,并将其与环境中实体的观察结果结合起来,以确定哪些实体应该接收消息,哪些应该避免。Dynalang 的表现优于 IMPALA、R2D2 以及使用专门架构对文本和观察进行推理的任务特定 EMMA 基线,特别是在最困难的第三阶段。
图片

图片


图片


图片


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: AI

相关推荐

CSR8670CSR8675智能语音Alexa蓝牙方案开发

资源下载 2017-12-14

AI/HPC新世代 COUPE光互连扮要角

网络与存储 2026-05-15

尼吉康的事业介绍

视频 2025-07-25

前Qwen负责人林俊旸创业,目标融资规模为数亿美元

2026-05-14

被动元件新周期:AI时代高端化、服务器化重构MLCC产业格局

EEPW2018年3月刊(工业物联网)

基于Microchip MCU的AI/ML培训教程1

视频 2025-11-12

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

视频 2025-12-19

基于Microchip MCU的AI/ML培训教程3

视频 2025-11-12

EEPW2018年6月刊(5G)

资源下载 2018-06-11

联发科加速AI在地化应用布局

智能计算 2026-05-19

国家“算力网”:像用水用电一样用AI

2026-05-18

AI聊天机器人能像医生一样推理吗?

存储器转型AI战略资源 台厂受惠

网络与存储 2026-05-19

思科凭借通用商用芯片与光模块赢得 AI 领域客户

电子元件培训教材

研华科技与Axelera AI深化战略合作 加速推动基于Europa平台的边缘AI创新

重新构想AI电源:塑造AI加速的未来(第三部分)

基于Microchip MCU的AI/ML培训教程2

视频 2025-11-12
更多 培训课堂
更多 焦点
更多 视频

技术专区