- 2月10日,豆包大模型团队联合北京交通大学、中国科学技术大学,发布了视频生成模型——VideoWorld,并且已开源代码与模型。与Sora、DALL-E等主流多模态模型不同,VideoWorld开辟了新的路径,打破对语言模型的依赖,实现仅靠“视觉信息”认知世界。就像幼儿能在不依赖语言的情况下理解真实世界一样,VideoWorld通过浏览视频数据,让机器掌握推理、规划和决策等复杂能力。在仅有300M参数量时,它就已展现出可观的性能,达到专业5段9x9围棋水平,还能在多种环境中执行机器人任务。在模型构建方面,
- 关键字:
VideoWorld 模型 机器视觉
videoworld介绍
您好,目前还没有人创建词条videoworld!
欢迎您创建该词条,阐述对videoworld的理解,并与今后在此搜索videoworld的朋友们分享。
创建词条
关于我们 -
广告服务 -
企业会员服务 -
网站地图 -
联系我们 -
征稿 -
友情链接 -
手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社 版权所有 北京东晓国际技术信息咨询有限公司

京ICP备12027778号-2 北京市公安局备案:1101082052 京公网安备11010802012473