12月2日,千问APP接入万相系列最新模型Wan2.5,视频创作能力再度升级。动作精度和肢体协调性全面提升,并成为首个支持音视频同时输出的移动端AI助手。
阿里万相2.5是目前业界少数具备音画同步能力的视频模型之一,该模型同时支持理解和生成等多种任务,支持文本、图像、视频、音频多种模态的输入和输出,在权威大模型评测LMArena上,万相的图生视频能力位居全球第三,稳居国内第一。
在千问APP上,用户只需一张照片和一段文字,无需模板,即可生成一段肢体动作自然、口型匹配准确的1080P高清唱跳视频,最长支持10S。测试显示,无论是真人照片、萌宠、二次元角色,还是文物、卡通形象,千问APP都可支持。

去年年初,阿里推出的照片跳舞功能迅速火爆国内外,激发了网友的创作热情,兵马俑、萌娃、萌宠跳舞视频在全网流传。此次,千问APP接入万相2.5后,不仅全面提升视频创作效果,还进一步降低视频创作门槛,支持用户自定义上传照片和输入文字,例如,用户仅需输入一张图片和一段“小猫一边唱歌,一边跳舞”的文字,千问APP便能精准生成视频,让静态形象瞬间“活”起来。

这一能力上线后,再次激发了网友的创作热情,社交平台上涌现出一批更具创意的“照片唱跳”内容。例如,用户可以先通过千问APP将两张图片融合,生成一张“中世纪名画”风格的合照,再输入“图中的人物一边唱歌、一边跳舞,镜头要有动态感”等文字,即可实现合唱、群舞的视频效果,且能够保持高质量的动感表现和极强的主体一致性。

据悉,千问App公测仅一周,下载量就突破1000万次,超越ChatGPT、Sora、DeepSeek成为史上增长最快的AI应用。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则