不只是生成视频:谷歌 Veo3惊艳亮相，可自动玩数独、解迷宫 | 七个圈

首页
行业资讯
文章详情

不只是生成视频:谷歌 Veo3惊艳亮相，可自动玩数独、解迷宫

2025-09-29
行业资讯
原创文章

1.2万
0
0
0

2034°

关注AI领域动态，传递精准资讯，助力读者洞悉AI行业的最新资讯。

2.3万文章
0 粉丝
0 关注

最近更新

1.算力利用率破65%:AIGCode如何用“L3级”编程模型突围?

2.Mistral AI开源数学证明利器：119B参数只激活6B，解题成本仅为竞品百分之一

3.15 岁少年利用AI实施勒索攻击，致知名平台全站停服

文章目录

不只是生成视频:谷歌 Veo3惊艳亮相，可自动玩数独、解迷宫

#视频生成模型

热门

根据谷歌研究部门的最新披露，其视频生成模型 Veo3 在视觉AI领域取得了突破性进展，被誉为达到了“GPT-3”时刻。在对 Veo3进行了一系列测试后，研究人员发现，该模型不仅限于视频生成，还能在无需额外训练的情况下，自动完成多项复杂的视觉任务。

在用18，384个最简单的视频生成任务进行测试时，Veo3展示出惊人的多功能性，包括寻找物体、修复照片、玩迷宫、解决数独等。具体来说，Veo3能够:

理解图像:自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。
理解物理原理:具备基本的物理认知，例如能够分辨出哪些物体会漂浮，哪些会下沉，并理解光的反射方式。
进行手动编辑:像“自动版 Photoshop”一样，Veo3可以执行复杂的图片编辑任务，如去除背景、添加文字，甚至将照片转换为油画风格。
具备“理性”能力:在面对迷宫图像时，它能够自主规划并绘制出穿过迷宫的路径。

谷歌研究部门认为，Veo3的这一突破标志着视觉AI领域进入了新的发展阶段，其通用性和自主任务解决能力堪比自然语言处理领域的GPT-3。

快手发布KAT系列Agentic Coding大模型代码表现出色

风投巨头押注AI改造传统服务业：General Catalyst投入15亿美元，目标实现软件级利润率

发评论，每天都得现金奖励！超多礼品等你来拿

在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

关联网址

关联标签

#视频生成模型

相关文章

拖更三年万字长文，前OpenAI安全VP翁荔拆解Scaling Laws：你的模型可能喂错了数据

拖更三年万字长文，前OpenAI安全VP翁荔拆解Scaling Laws：你的模型可能喂错了数据

单秒成本直降一半，字节跳动发布 Seedance 2.0 Mini 视频生成模型

单秒成本直降一半，字节跳动发布 Seedance 2.0 Mini 视频生成模型

谷歌发布 Veo3.1Lite:视频生成成本降幅超50%，支持1080p 多格式输出

谷歌发布 Veo3.1Lite:视频生成成本降幅超50%，支持1080p 多格式输出

视频号要有对手了？OpenAI 计划将 Sora 接入 ChatGPT：Disney 角色或成付费杀手锏

视频号要有对手了？OpenAI 计划将 Sora 接入 ChatGPT：Disney 角色或成付费杀手锏

字节跳动暂停Seedance2.0全球发布，法律合规挑战迫使AI视频模型延期

字节跳动暂停Seedance2.0全球发布，法律合规挑战迫使AI视频模型延期

七个圈