国内领先的视频大模型 Vidu 今日宣布,其开放平台正式上线“一键生成 MV”功能。这一技术的推出,标志着视频创作从素材拼接迈向了全自动的端到端生成时代。用户现在只需提供背景音乐、参考图像以及简单的文本指令,系统即可在分钟级别内输出画质精美、叙事连贯的高质量 MV。

​Vidu 发布 AI 一键生成 MV 功能,打造分钟级“虚拟制片厂”

该功能的核心在于一套深度协同的多智能体(Multi-Agent)系统。在接收到用户指令后,系统内部的多个专用 AI 智能体会立即开启精密协作。首先,导演智能体会对音乐结构和歌词进行深度解析,规划出整体的叙事脉络;随后,分镜脚本智能体会将创意转化为详细的镜头描述,涵盖景别、运镜和时长等专业参数。

在视觉生成阶段,该系统表现出了极高的工业级稳定性。通过“多图参考生视频”技术,创作者最多可上传7张参考图作为视觉锚点,视觉生成智能体据此在长达五分钟的视频中精准维持角色、场景和美学风格的高度统一。最后,剪辑与合成智能体会负责镜头的转场卡点,并自动生成与歌词逐帧同步的动态字幕。

这种“全自动制片”模式无需人工干预,极大地降低了专业视频创作的门槛。对于创作者而言,Vidu 不再仅仅是一个生成工具,而是一个集成化的虚拟制片厂,让复杂的 MV 制作变得像发送指令一样简单。

划重点:

  • 🎬 全自动多智能体协同:系统内置导演、分镜、视觉生成及剪辑四大智能体,实现从解析音乐到成片输出的全流程自动化。

  • 🖼️ 工业级风格一致性:支持最多7张参考图定位,确保在长达5分钟的视频中,角色与场景风格不发生漂移。

  • 🎵 音画同步精准卡点:AI 能自动识别背景音乐节奏并完成转场,同时生成逐帧同步的动态字幕,分钟级即可交片。