6月5日,在2026AI产业应用大会上,腾讯云音视频正式发布AI原生能力底座WAND。 依托超过20年的技术积累,腾讯云音视频此次从底层模型、媒体能力到接入方式进行全面升级,音视频媒体AI能力将以Agent-Native模式向行业开放,实现了从提供单点媒体处理能力向面向AI应用与Agent的原生媒体底座的战略升级。

WAND架构由模型引擎、能力层和场景方案三层构成,包含编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型,补充了主流生成式大模型在媒体生产流程中的不足。能力层则将60+项媒体AI能力按生成、理解、处理、编码重新组织,通过API、Agent预编排工作流(Agentic Workflow)和Skills三种模式开放,支持Agent端到端自动跑通整条链路,无需切换工具。

WAND能力架构图
在真实业务中,WAND展现出高适配与高效率优势。在电商应用中,WAND生成模型可针对不同品类定制处理策略,有效降低报错率并提升图片可用率。在短漫剧创作中,WAND将剧本生成、角色一致性保持等环节串联为自动链路,使平均生产效率提升90%,已服务国内80%以上的头部漫剧平台,其AI增强与无痕擦除技术更是双双荣获NAB Show2026年度产品奖。
此外,面对高并发、极低延迟要求的赛事直播场景,WAND通过自研模型协同调度,将识别、生成、合成、编码整合为全自动化流程,相较传统方案可节省超50%的码率,已累计支撑数千场全球顶级赛事。
作为连续11次保持中国及出海市场份额第一的领跑者,腾讯云音视频此举正加速音视频能力成为可被Agent统一调度的生产级工具,全面赋能AI Agent时代的视听应用创新。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则