Midjourney 正式发布其首个 AI 视频生成模型 V1,标志着这家以图像生成闻名的公司迈向多媒体创作领域的全新里程碑。作为全球领先的 AI 创意平台,Midjourney 的此次发布引发了数字艺术与视频创作者的广泛关注。本文由 AIbase 编辑部整理最新网络信息,为您详细解读 V1模型的核心亮点与未来潜力。
从静态到动态:V1模型的核心功能
Midjourney V1视频生成模型主打 图像到视频(Image-to-Video, I2V) 功能,用户可通过其网页界面上的“Animate”按钮,将静态图像转化为动态视频。默认生成时长为5秒 的短视频,每次生成提供 四段不同风格的视频片段,用户可选择最符合需求的版本。此外,视频时长支持以 每次4秒 的增量延长,最长可达20秒。
V1提供两种运动模式:
低动态模式:适合环境场景,相机保持相对稳定,主体以缓慢或刻意的方式移动,营造沉浸式氛围。
高动态模式:适用于节奏感更强的场景,带来更具冲击力的视觉效果。
用户可选择 自动动画模式,由 AI 决定运动方式,或通过文本提示进行 手动定制,进一步调整视频的创意方向。Midjourney 强调,V1继承了其图像模型 V6.1的高一致性,确保生成的视频在细节与风格上保持卓越品质。
定价亲民,面向广泛创作者
Midjourney 以 低成本高可及性 为目标,V1模型的定价策略延续了其一贯的亲民风格。最低只需10美元/月 的 Basic 订阅计划即可体验视频生成功能,而 Pro 计划(60美元/月) 和 Mega 计划(120美元/月) 的用户则可在“Relax”模式下享受 无限制视频生成。不过,视频生成任务的计算成本约为图像生成的8倍,用户需合理规划月度配额。
与此同时,Midjourney 暂未提供视频的 超分辨率增强 或 音频生成 功能,当前输出分辨率为480p,帧率为24帧/秒。尽管在功能上与 Runway Gen-4、Luma Dream Machine 或 OpenAI 的 Sora 等竞品相比略显基础,但其低门槛与高品质的视觉风格仍使其在市场中占据独特位置。
面向未来:Midjourney 的宏大愿景
Midjourney 首席执行官 David Holz 在博客中表示,V1模型是公司迈向 实时开放世界模拟 目标的重要一步。相较于为好莱坞或广告行业生成简单的 B-roll 素材,Midjourney 更专注于构建能够生成 交互式3D 模拟 的 AI 模型。Holz 强调:“我们需要视觉(图像模型),需要让图像动起来(视频模型),这是通往未来世界的基石。”
V1的发布不仅是技术突破,也为 Midjourney 的生态系统注入了新活力。结合其最新发布的 V7文本到图像模型,用户可从文本生成图像,再无缝转化为视频,形成完整的创意闭环。这种 端到端创作流程 为独立创作者、数字艺术家与中小企业提供了高效的工具。
挑战与争议:版权诉讼阴影
尽管 V1发布引发热议,Midjourney 却面临来自 迪士尼 和 环球影业 的版权侵权诉讼。两家好莱坞巨头指控 Midjourney 的 AI 模型在未经授权的情况下使用其知识产权(如《星球大战》、《小黄人》等角色)进行训练,并生成近乎复制的图像与视频。此诉讼可能对 Midjourney 的视频服务扩展构成挑战,也为整个生成式 AI 行业的版权规范敲响警钟。
用户反馈与市场反响
根据网络上的最新反馈,V1模型因其 操作简便 和 视觉美感 受到创作者的广泛好评。许多用户表示,即使不输入复杂提示,V1也能生成具有 真实感 和 细腻细节 的视频,尤其在低动态场景中表现突出。然而,高动态场景可能出现轻微闪烁问题,显示其技术仍有优化空间。
与此同时,V1的发布在社交媒体上掀起热潮。创作者们纷纷分享通过 V1生成的短视频,展示了从梦幻风景到科幻场景的多样化应用。Midjourney 的社区活跃度进一步提升,预计将吸引更多新用户加入其平台。
AIbase 编辑认为 Midjourney V1的推出不仅是技术层面的突破,更是对 AI 创意工具民主化的又一次推动。其低成本与高品质的结合,使更多独立创作者能够以极低的门槛进入视频创作领域。尽管当前功能较为基础,但 Midjourney 的清晰路线图与宏大愿景表明,V1只是其视频生成旅程的起点。
未来,我们期待 Midjourney 在 分辨率提升、文本到视频功能 以及 音频整合 方面带来更多创新。同时,版权争议的解决也将是其能否持续领跑的关键。AIbase 将持续关注 Midjourney 的动态,为您带来第一手行业资讯。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则