头部广告

北大与DeepSeek联合开源DSpark框架,高并发下生成速度提升超60%

日期:2026-06-27 16:31:54 栏目:sql 阅读:
Python编程报道,6月27日,DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率瓶颈。该框架已部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中,相比此前生产环境采用的单token推测解码基线MTP-1,在同等吞吐量水平下可将单用户生成速度提升60%至85%。相关论文、训练代码及模型检查点已在GitHub平台DeepSpec项目中开源。

我来作答

关于作者

1785

提问

50万+

阅读量

0

回答

0

余额

3万+

被赞

3万+

被踩