刚刚,DeepSeek发布更新
DeepSeek更新日志显示,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,主要包括以下方面:一是语言一致性,缓解了中英文混杂deepseek、偶发异常字符等情况;二是Agent能力,进一步优化了Code Agent与Search Agent的表现。
今年年初,开源大模型DeepSeek曾掀起“开源潮”,引爆AI行业。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。
9月17日,DeepSeek-R1推理模型研究论文登上最新一期的Nature封面,引起广泛关注。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者。该文章揭示了开源人工智能模型DeepSeek-R1所采用的大规模推理模型训练方法。开发团队称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。
在模型迭代方面,8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。
其中,智能体支持能力方面,DeepSeek聚焦热门发展方向对编程智能体、搜索智能体展开测评,测试结果显示,DeepSeek-V3.1相较此前模型均有提升。在编程智能体方面,在代码修复测评SWE-bench(最具代表性的代码修复评测基准之一)等复杂任务测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。在搜索智能体方面,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试与多学科专家级难题测试上,DeepSeek-V3.1性能已大幅领先DeepSeek-R1-0528。
同时,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。
华安证券研报称,DeepSeek V3.1发布后即带动国产算力产业链标的大幅上涨。未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。DeepSeek V3.1在AI Agent能力端显著提升,未来将继续推动AI Agent商业化场景应用。原文出处:刚刚,DeepSeek发布更新,感谢原作者,侵权必删!