在人工智能生成内容(AICG)领域持续高速发展的背景下,清华大学 TSAIL 实验室携手生数科技再次引爆行业关注——他们联合发布了名为 TurboDiffusion 的全新开源视频生成加速框架。该技术实现了端到端扩散模型推理效率的革命性突破,在完全保留原始生成质量的前提下,将整体运算速度提升了惊人的100至200倍,为AI视频创作生态注入了前所未有的动能。

据AIbase深入了解,TurboDiffusion之所以能实现如此极致的性能优化,核心在于其融合了多项前沿算法创新。框架深度集成了SageAttention机制与SLA(稀疏线性注意力),有效缓解了高分辨率视频序列处理中的显存瓶颈与计算冗余问题。更为关键的是,研发团队引入rCM时间步蒸馏技术,通过智能压缩扩散过程中的采样步骤,在确保画面连贯性和细节还原度的同时,大幅降低了模型迭代所需的计算资源消耗,真正实现了“轻量级”高质量输出。
实测数据进一步验证了其卓越表现。GitHub平台公开的测试结果显示,在单张RTX5090消费级显卡上运行时,一段原本需耗时184秒才能生成的5秒高清视频,现仅需1.9秒即可完成。而对于参数规模更大的工业级模型任务,例如720P分辨率下的长序列生成,传统流程约需72分钟,而启用TurboDiffusion后,整个过程被惊人地缩短至38秒,效率提升超过百倍,远超当前主流加速方案的实际表现。
目前,该项目已全面开源,并开放多种规格的预训练模型权重供社区自由下载使用。针对不同硬件配置场景,开发团队贴心地提供了差异化优化策略:面向RTX4090、RTX5090等民用显卡用户推出量化版本以适配有限显存;同时为配备H100等高端算力卡的企业级应用提供非量化高性能版本,充分兼顾效率与画质需求。这一举措显著拉低了高质量AI视频生产的硬件门槛,使得个体创作者和中小企业也能高效部署专业级生成系统。

github:https://github.com/thu-ml/TurboDiffusion
划重点:
-
⚡ 效能飞跃:清华开源框架将 AI 视频生成提速最高200倍,RTX5090显卡可实现1.9秒产出5秒视频。
-
🛠️ 技术核心:通过 SageAttention、稀疏线性注意力机制以及时间步蒸馏技术,在不损耗画质的情况下大幅削减算力需求。
-
🌐 全面适配:框架已开放模型权重,并针对不同显存容量的显卡提供了量化优化方案,极大降低了高性能 AI 视频生成的门槛。
