DeepSeek更新V4版AI模型推理速度最高提升85%

中国人工智能初创公司深度求索（DeepSeek）更新了最新的V4版本AI模型，将模型推理速度最高提升了85%。（路透社档案照片）

（北京综合讯）中国人工智能（AI）初创公司深度求索（DeepSeek）更新了最新的V4版本模型，将推理速度最高提升85%，并大幅降低部署成本。

综合华尔街见闻和IT之家报道，DeepSeek星期六（6月27日）更新了V4版本，推出推测解码（Speculative Decoding）框架DSpark，并开源全栈工具DeepSpec。

DeepSeek-V4-Pro-DSpark并非全新架构模型，而是在DeepSeek-V4-Pro的基础上引入推测解码模块。因此，此次更新的重点在于工程落地，而非模型能力本身的迭代。

推测解码是一种在不影响模型输出结果的前提下，有效提升推理效率的技术，先由轻量级模型预先生成候选内容，再交由主模型进行验证，从而加快大型语言模型的推理速度。

DeepSpec则是用于训练与评估推测解码草稿模型的完整开源工具，包含数据准备、模型训练、草稿模型实现及性能评估等功能。这可协助研究员直接训练推测解码模型，大幅降低部署门槛。

根据DeepSeek创始人梁文锋与北京大学共同发表的论文，将DSpark部署在DeepSeek-V4线上服务系统中并在真实用户流量环境下运行，可有效减少因无效验证而造成的算力浪费。

这是DeepSeek在完成500亿元人民币（95.3亿新元）融资后，率先在AI推理效率优化领域推出的成果。这显示公司除了聚焦提升模型能力，也力图在算力效率竞争中取得优势。

目前，中国企业所开发的AI模型正朝着高性能、低成本的轻量化方向发展，这一趋势正动摇美国企业长期以来的主导地位。

彭博社报道，OpenRouter的数据显示，截至今年6月，向谷歌、OpenAI和Anthropic模型发出的词元（Token）请求份额，已从一年前的72%大降至33%；而截至3月，中国AI模型的份额已升至60%以上。

最新