知名AI专家李飞飞创立的World Labs近日正式推出其首个商业产品——Marble3D世界模型公测版。这一创新工具支持从文本提示、单张图像、多张图片、视频或粗糙3D布局直接生成完整、可导航的3D虚拟世界,用户不仅能实时交互编辑,还可轻松导出Gaussian splats(高斯溅射)、三角网格或视频格式。

李飞飞World Labs放大招!Marble 3D世界模型公测,文本/图片秒变可交互虚拟宇宙

继两个月有限beta测试后,此次公测标志着World Labs从实验室概念向实用工具的华丽转身,估值已超12.5亿美元的初创公司,正以“大型世界模型”重塑AI生成内容的边界。

Marble的核心突破:多模态输入,一键构建沉浸式3D世界

Marble的魅力在于其多模态生成能力,用户只需输入简单描述或上传媒体,即可生成大规模、风格多样的3D环境。生成过程通常只需10分钟左右,输出结果几何结构清晰、一致性强,支持实时探索(如鼠标导航浏览)。具体亮点包括:

灵活输入与即时生成:从单一文本提示(如“未来城市街景”)或图像扩展到完整世界;多图融合可合并环境,视频输入则捕捉动态元素,确保输出持久且可导航。

交互式编辑与扩展:内置Chisel实验性3D编辑器,用户可先粗略勾勒空间布局(如墙壁、房间或地形),再用文本提示注入视觉风格。这种“结构分离风格”的设计类似于HTML与CSS的组合,避免了纯文本编辑的局限性。支持一键扩展现有世界,或无缝组合多个场景,构建大型虚拟空间。

多格式导出,跨平台应用:生成后可直接下载Gaussian splats(用于高效渲染)、三角网格(适用于建模软件)或增强视频(添加细节、运动并清理边缘)。这让Marble成为游戏开发、视觉特效(VFX)和虚拟现实(VR)项目的理想资产。

World Labs强调,Marble并非一次性生成,而是“持久性”世界模型,能模拟物理真实性,减少生成过程中的变形和不一致问题。公测版已集成Marble Labs工作区,提供案例研究和文档,帮助创作者探索工作流。

行业影响:3D路径 vs 视频路径,谁将主导AI内容生成?

此次公测让World Labs在“世界模型”赛道中脱颖而出,与谷歌DeepMind的Genie(仍处研究预览)及新兴初创如Decart、Odyssey形成直接竞争。

专家指出,Marble的3D焦点填补了当前AI多局限于2D文本/图像的空白,推动从“阅读写作”向“感知构建”的跃进。潜在应用包括机器人训练模拟(生成真实环境数据)和影视制作(快速原型化场景)。有趣的是,这一工具或将重塑视频数据生成生态。用户可利用Marble从3D世界导出高质量视频序列,结合AI增强(如添加运动轨迹),高效制造训练数据集。这比纯视频路径(如Sora式生成)更具空间深度,适用于需要物理一致性的场景。

未来,随着模型迭代,3D路径或将胜出——但视频路径的即时性仍具优势。World Labs联合创始人表示,此为“空间智能”的第一步,下一代模型将赋能人类与AI代理共同互动虚拟世界。结语:AI空间革命启幕,创作者的3D playground来了Marble的公测不仅点燃了AI生成3D的热情,也为开发者打开了无限创意之门。免费版提供基础生成,付费计划(标准版20美元/月起)解锁更多配额和商业权。

体验地址:https://marble.worldlabs.ai/worlds