MiniMax 近日宣布正式发布 MiniMax Music2.5。 此次升级的核心目标是打破 AI 音乐在“可控性”与“真实度”上的长期瓶颈,通过技术迭代让格莱美级的专业创作变得触手可及。

​MiniMax Music 2.5 正式发布:攻克 AI 音乐“控”与“真”两大难题

相较于上一代,Music2.5在两大维度实现了跨越式突破:

  • 段落级强控制(Direct the Detail): 模型开放了全段落标签控制,精准支持前奏(Intro)、桥段(Bridge)、副歌(Hook)等14种结构变体。 创作者可以像专业编曲人一样,通过标签精准调控乐器配置与情感张力,而非依靠运气随机生成。

  • 物理级高保真(Define the Real): 通过系统性优化,Music2.5实现了连续细腻的转音、自然起伏的颤音以及多腔体共鸣切换,显著增强了人声的生命力。 此外,模型扩充了超100种乐器音色库,并能根据风格自动调整混音策略,确保人声与伴奏在密集场景下依然清晰分明。

针对华语市场,Music2.5进行了深度定制,大幅优化了 C-Pop 与 C-Rap 的旋律逻辑,极大减少了吞字、糊音等问题,即使是中英文混搭场景也能保持流畅衔接。 目前,MiniMax Music2.5已在其官网及 API 平台同步上线。

​MiniMax Music 2.5 正式发布:攻克 AI 音乐“控”与“真”两大难题

产品体验:

minimaxi.com/audio/music

API 接口:

platform.minimaxi.com/docs/api-reference/music-generation

划重点:

  • 🎵 全段落掌控:支持14种音乐结构标签,让 AI 创作从“随机生成”转向“精准指挥”。

  • 🎤 真实人声质感:具备细腻的转音与颤音表现,支持男女对唱中的自然协同感与和声层次。

  • 🎹 专业级混音:内置百余种乐器音色,具备自动适配风格的混音能力,实现录音室级音频交付。

  • 🇨🇳 华语深度优化:针对中文咬字及华语流行趋势进行系统级提升,适配各类流行及说唱场景。