近日,清华大学 TSAIL 实验室联合生数科技推出了全新的开源视频生成加速框架TurboDiffusion。这一突破性的技术框架在确保视频生成质量不减的前提下,成功将端到端扩散生成的推理速度提升了100至200倍。

​清华开源 TurboDiffusion:AI 视频生成步入“秒级”时代,最高提速达 200 倍

AIbase 获悉,该框架为了实现极致的生成效率,集成了 SageAttention 和 SLA(稀疏线性注意力机制)。这些技术显著降低了模型在处理高分辨率视频内容时的计算开销。此外,开发团队还引入了 rCM(时间步蒸馏)技术,通过大幅减少扩散过程中的采样步数,让视频生成在保持视觉一致性的同时,实现了极低的计算延迟。

根据GitHub公布的实测数据,TurboDiffusion 的加速表现令人震惊。在单张 RTX5090显卡上,原本生成5秒视频需要184秒,而使用该框架后仅需1.9秒即可完成。对于参数量更大的模型,其提升更为显著:原本耗时约1.2小时的720P 视频生成任务,现在被压缩到了短短38秒,性能远超目前市面上的同类加速方案。

​清华开源 TurboDiffusion:AI 视频生成步入“秒级”时代,最高提速达 200 倍

目前,TurboDiffusion 已开源并提供了多种规格的模型权重供用户下载。针对消费级显卡(如 RTX4090/5090)和工业级显卡(如 H100),团队分别提供了量化版与非量化版的优化方案。这意味着无论是个人创作者还是企业级用户,都能通过这一工具显著提升 AI 视频的生产效率。

github:https://github.com/thu-ml/TurboDiffusion

划重点:

  • 效能飞跃:清华开源框架将 AI 视频生成提速最高200倍,RTX5090显卡可实现1.9秒产出5秒视频。

  • 🛠️ 技术核心:通过 SageAttention、稀疏线性注意力机制以及时间步蒸馏技术,在不损耗画质的情况下大幅削减算力需求。

  • 🌐 全面适配:框架已开放模型权重,并针对不同显存容量的显卡提供了量化优化方案,极大降低了高性能 AI 视频生成的门槛。