10月9日,马斯克旗下 xAI 宣布推出其最新视频生成模型 Imagine v0.9,标志着该公司在多模态 AI 创作领域取得重大突破。相比早期版本 v0.1,新模型在画质、动作自然度与音频生成等方面实现了全面飞跃。

 三大核心升级

  • 视觉质量:画面分辨率更高、细节更丰富,整体质感接近专业电影级水平。

  • 动作生成:人物与场景运动更加流畅自然,动作衔接无明显断层。

  • 音频能力:新增原生音频生成,可同步生成背景音乐、对白及歌唱内容。

 一键生成电影级作品

Imagine v0.9可实现 “即时生成、无需后期编辑” 的完整视频输出,支持智能构图、镜头运动控制等功能,让创作者在数秒内生成具备电影叙事感的短片或长视频。

模型特色功能

  • 同步音效:画面与音效实现帧级匹配,增强沉浸感。

  • 动态摄影机效果:支持自动智能聚焦、景深调节等电影镜头语言。

  • 自然对话与唱歌生成:角色能生成清晰、情感同步的语音或歌唱。

  • 舞蹈与节奏识别:AI 能精准捕捉音乐节奏,生成协调动作。

xAI 表示,Imagine v0.9的推出为 AI 视频创作打开了新的边界,用户可在文本提示下快速生成具备视觉叙事、声音表现与节奏感的完整多模态作品。