专栏中心

EEPW首页 > 专栏 > 时间、空间可控的视频生成走进现实，阿里大模型新作VideoComposer火了（1）

时间、空间可控的视频生成走进现实，阿里大模型新作VideoComposer火了（1）

发布人：机器之心时间：2023-06-12 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

在 AI 绘画领域，阿里提出的 Composer 和斯坦福提出的基于 Stable diffusion 的 ControlNet 引领了可控图像生成的理论发展。但是，业界在可控视频生成上的探索依旧处于相对空白的状态。

相比于图像生成，可控的视频更加复杂，因为除了视频内容的空间的可控性之外，还需要满足时间维度的可控性。基于此，阿里巴巴和蚂蚁集团的研究团队率先做出尝试并提出了 VideoComposer，即通过组合式生成范式同时实现视频在时间和空间两个维度上的可控性。

论文地址：https://arxiv.org/abs/2306.02018
项目主页：https://videocomposer.github.io

前段时间，阿里巴巴在魔搭社区和 Hugging Face 低调开源了文生视频大模型，意外地受到国内外开发者的广泛关注，该模型生成的视频甚至得到马斯克本尊的回应，模型在魔搭社区上连续多天获得单日上万次国际访问量。

Text-to-Video 在推特

VideoComposer 作为该研究团队的最新成果，又一次受到了国际社区的广泛关注。

VideoComposer 在推特

事实上，可控性已经成为视觉内容创作的更高基准，其在定制化的图像生成方面取得了显着进步，但在视频生成领域仍然具有三大挑战：

复杂的数据结构，生成的视频需同时满足时间维度上的动态变化的多样性和时空维度的内容一致性；
复杂的引导条件，已存在的可控的视频生成需要复杂的条件是无法人为手动构建的。比如 Runway 提出的 Gen-1/2 需要依赖深度序列作条件，其能较好的实现视频间的结构迁移，但不能很好的解决可控性问题；
缺乏运动可控性，运动模式是视频即复杂又抽象的属性，运动可控性是解决视频生成可控性的必要条件。

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词： AI

相关推荐

继上次海联达Ai-ap100拆机之电源改造

zhuwei0710 2013-04-03

WTC-AI太阳能热水器电路图

设计方案 WTC-AI 太阳能热水器电路图 2012-07-24

存储器转型AI战略资源台厂受惠

AI服务器带动高容量DDR5 RDIMM与高容量QLC/TLC，成为单片晶圆产值最高的内存产品。在高阶产能稀缺下，韩系及美系内存原厂产能配置，全面倾斜AI相关高产值产品。另一方面，随Agentic AI推动模型由训练转...

网络与存储存储器 AI 2026-05-19

iCAN-4017 AI功能模块

iCAN-4017 AI功能模块...

资源下载周立功单片机功能模块 iCAN-4017 AI 2007-03-30

海联达（Aigale）Ai-HD1 无线全高清套件拆解

zhuwei0710 2013-04-28

基于Microchip MCU的AI/ML培训教程1

本视频介绍基于Microchip MCU的人工智能（AI）和边缘机器学习（ML），重点讲解Microchip ML Suite工具，通过简单的AI演示，帮助工程师快速掌握嵌入式人工智能与机器学习技术，实现智能应用落地。 ...

视频 Microchip eRTC Microchip AI ML MCU 2025-11-12

人工智能是如何帮助阻止造假者的？

谢丫丫 2018-08-14

电子元件培训教材

电子元件培训教材...

资源下载 NBA 电子元件识别电阻识别电容识别 AI MI SMT DIP 静电防护 2008-09-20

WTC-AI型太阳能热水器电路图

设计方案电子电路图，WTC-AI 太阳能热水器电路热水器 2012-07-30

AI/HPC新世代 COUPE光互连扮要角

台积电技术论坛聚焦先进制程与系统整合布局。台积电业务开发组织先进技术业务开发资深处长袁立本指出，AI与HPC应用正加速推动先进逻辑制程演进，台积电除持续扩充2纳米平台，也同步强化CoWoS、SoIC与COUPE光互连技...

网络与存储 AI HPC COUPE 光互连 2026-05-15

重新构想AI电源：塑造AI加速的未来（第三部分）

现在来探讨下一波浪潮——垂直供电。这背后离不开ADI公司不懈的创新。持续关注本系列的读者一定清楚当下的挑战：AI需要在更小的空间内，获得更充足的电力、更高频的供电，且绝不允许出现任何差错。多相PoL改良技术已经取得了长足...

电源与新能源垂直供电 AI PCB ADI 2026-05-14

国家“算力网”：像用水用电一样用AI

最近，“算力网要来了”的话题刷了屏。简单来说，国家要把分布在全国各地的数据中心、超算中心连成一张“算力版的国家电网”，让算力像水、电一样，成为即插即用的公共基础资源。为什么急？AI的“电表”转得飞快国家数据局披露，截至2...

AI Token 算力 2026-05-18

万家乐JSYZ5-AI燃气热水器电路图

设计方案电路图热水器燃气 JSYZ5-AI 万家乐 2013-01-17

EEPW2018年3月刊(工业物联网)

1.TE扎根中国三十年鼎力支持中国创新 2.中国MCU市场观察 3.用于边缘设备的AI为设备制造商营造机会 4.工业物联网技术方案及发展大潮 5.工业物联网带来怎样的机遇和挑战？距离现实有多远？ 6.工业4....

资源下载工业物联网 AI 2018-03-12

基于Microchip MCU的AI/ML培训教程2

本视频介绍基于Microchip MCU的人工智能（AI）和边缘机器学习（ML），重点讲解Microchip ML Suite工具，通过简单的AI演示，帮助工程师快速掌握嵌入式人工智能与机器学习技术，实现智能应用落地。...

视频 Microchip eRTC Microchip AI ML MCU 2025-11-12

CSR8670CSR8675智能语音Alexa蓝牙方案开发

BT Command：使用Voice AI，语音助理的蓝牙耳机。 BT CommandTM – Alexa 让你蓝牙耳机蓝牙音箱成为行动智能语音助手...

资源下载 AI 智能语音 2017-12-14

瑞萨电子AI单元解决方案成功提高GE医疗（日本）日野工厂的生产力

winni945 2018-09-12

基于VisitionX制造智能眼镜

设计方案 AI 智能眼镜 VisitionX 2025-08-12

被动元件新周期：AI时代高端化、服务器化重构MLCC产业格局

随着AI服务器、高性能计算、电动车与机器人等新型应用快速崛起，MLCC产业正在发生一次结构性的技术升级与市场重构，甚至有人预言MLCC市场发展将是下一个存储器。 ...

元件/连接器被动元件 AI MLCC 2026-05-19

尼吉康的事业介绍

尼吉康的事业介绍...

视频 nichicon 尼吉康汽车电子 IoT AI 2025-07-25

基于Microchip MCU的AI/ML培训教程3

本视频介绍基于Microchip MCU的人工智能（AI）和边缘机器学习（ML），重点讲解Microchip ML Suite工具，通过简单的AI演示，帮助工程师快速掌握嵌入式人工智能与机器学习技术，实现智能应用落地。...

视频 Microchip eRTC Microchip AI ML MCU 2025-11-12

联发科加速AI在地化应用布局

联发科AI布局由晶片端延伸至企业应用与泛在连网场景，除集团旗下「联发创新基地（MediaTek Research）」携手赛微科技（Cyberon）推动中国台湾企业专属在地化AI应用; 此外，联发科近年积极布局卫星直连手机...

智能计算联发科 AI D2C NTN 2026-05-19

AI聊天机器人能像医生一样推理吗？

核心要点OpenAI 大语言模型（LLM）在真实急诊病例的临床推理任务中表现超越医生。研究界对 AI 临床推理的评估标准尚无共识，结果解读差异巨大。AI 存在编造信息、幻觉等风险，但人机协同是未来方向。医学计算最早目标之...

智能计算 AI 聊天机器人推理 2026-05-15

基于Ai-WB2-12F与Rd-04的雷达检测系统

设计方案雷达 Ai-WB2-12F Rd-04 2025-08-12

前Qwen负责人林俊旸创业，目标融资规模为数亿美元

据The Information报道，前阿里通义千问Qwen核心负责人林俊旸正在为其新成立的AI实验室寻求融资，目标融资规模为数亿美元。高榕资本和红杉中国正在洽谈参与本轮融资，如果交易完成，这家尚处早期的新AI实验室估值...

阿里通义千问 Qwen AI 大模型 2026-05-14

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

Our VP of Product Development Roland Saint-Pierre explains why high-voltage PowiGaN technology offers the perf...

视频 pi ai PowiGaN DataCenters 2025-12-19

研华科技与Axelera AI深化战略合作加速推动基于Europa平台的边缘AI创新

全球物联网智能系统与嵌入式平台厂商研华科技宣布，与开创性的人工智能处理单元（AIPU）解决方案提供商Axelera AI开启全新战略合作，共同研发新一代搭载 Europa AIPU的边缘人工智能加速模块。这些联合解决方案...

智能计算研华 Axelera AI Europa AIPU 边缘AI 2026-05-14

释说芯语16：硬科技：构建企业未来之路（附PPT）

jackwang 2018-10-22

EEPW2018年6月刊(5G)

1.人工智能芯片市场广阔，需要静下心研发努力 2.2017中国半导体市场回顾及2018发展展望 3.5G技术及测试测量的挑战 4.ARM服务器芯片的挑战与应对策略探索 5.国产芯片的关键一步：华芯通首款芯片年底量...

资源下载 5G AI 2018-06-11

思科凭借通用商用芯片与光模块赢得 AI 领域客户

业内皆知，各大超大规模云厂商、云计算搭建企业与 AI 模型研发企业正全力搭建数据中心基础设施，以此落地自身人工智能发展规划。但占 AI 整体支出规模近半数的传统企业、电信服务商、政府机构、科研院校、新兴云服务商及主权机构...

智能计算思科通用商用芯片光模块 AI 2026-05-19

更多 培训课堂

更多焦点

更多视频

技术专区