可灵AI公司宣布,其自主研发的O1视频大模型已于今日零时起面向公众全量开放。该模型采用MVL(多模态视觉语言)统一交互架构,在单一输入框内融合文字、图像、视频三种指令,并首次引入Chain-of-Thought推理链路,官方称其为“全球首个统一多模态视频大模型”。

与业界常见的分步式流程不同,O1模型可一次性完成文生视频、图生视频、局部编辑及镜头延展任务,无需用户切换界面。可灵AI产品负责人表示,模型通过多视角主体构建技术锁定人物与物体特征,解决镜头切换时出现的“特征漂移”问题,确保多主体场景画面连贯。

目前,O1模型已在可灵App及官网同步开放体验,支持3–10秒时长自由设定,面向短视频创作者、广告团队及个人用户。公司透露,后续将开放API接口,供第三方平台集成。行业分析师认为,O1的上线或进一步降低AI视频制作门槛,但能否在生成质量与成本效率之间取得平衡,仍有待市场检验。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则