谷歌今日向Gemini Pro/Ultra订阅用户推送Veo3.1视频模型,新增“Ingredients to Video”模式,支持同时上传三张参考图,分别提取人物、场景与风格特征并融合为8秒1080p视频,生成内容自带SynthID隐形水印。用户可在网页或移动端输入文本提示后一键生成,系统保持跨帧角色一致性与光影连贯。

Gemini Veo 3.1上线多图参考 一次合成三元素视频

谷歌演示显示,三张不同角度自拍+赛博城市背景+油画风格图即可输出“印象派未来街头漫步”短片,脸部与服装零形变。Veo3.1同步输出原生环境音,支持首尾帧控制及视频延伸功能。

谷歌表示,多图参考功能已全量开放,生成配额与现有订阅额度一致,未公布额外付费方案。