(北京综合讯)中国人工智能(AI)初创公司深度求索(DeepSeek)更新了最新的V4版本模型,将推理速度最高提升85%,并大幅降低部署成本。
综合华尔街见闻和IT之家报道,DeepSeek星期六(6月27日)更新了V4版本,推出推测解码(Speculative Decoding)框架DSpark,并开源全栈工具DeepSpec。
DeepSeek-V4-Pro-DSpark并非全新架构模型,而是在DeepSeek-V4-Pro的基础上引入推测解码模块。因此,此次更新的重点在于工程落地,而非模型能力本身的迭代。
推测解码是一种在不影响模型输出结果的前提下,有效提升推理效率的技术,先由轻量级模型预先生成候选内容,再交由主模型进行验证,从而加快大型语言模型的推理速度。
DeepSpec则是用于训练与评估推测解码草稿模型的完整开源工具,包含数据准备、模型训练、草稿模型实现及性能评估等功能。这可协助研究员直接训练推测解码模型,大幅降低部署门槛。
根据DeepSeek创始人梁文锋与北京大学共同发表的论文,将DSpark部署在DeepSeek-V4线上服务系统中并在真实用户流量环境下运行,可有效减少因无效验证而造成的算力浪费。
这是DeepSeek在完成500亿元人民币(95.3亿新元)融资后,率先在AI推理效率优化领域推出的成果。这显示公司除了聚焦提升模型能力,也力图在算力效率竞争中取得优势。
目前,中国企业所开发的AI模型正朝着高性能、低成本的轻量化方向发展,这一趋势正动摇美国企业长期以来的主导地位。
彭博社报道,OpenRouter的数据显示,截至今年6月,向谷歌、OpenAI和Anthropic模型发出的词元(Token)请求份额,已从一年前的72%大降至33%;而截至3月,中国AI模型的份额已升至60%以上。
