当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

2个月前 (08-21)Deepseek最新资讯179

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

前场传导,让你陌生

前场传导,让你陌生

  最后差了点精度,不过今天比赛现场的风雨是真的大,有点影响传球了。樱桃今天的状态也就拉起来二三十分钟,希望正赛的时候能一直看到这样的表现。   最后差了点精度,不过今天...

湛江首发“鲲鹏矩阵”:全国司法行政AI大模型实现“0到1”的突破

湛江首发“鲲鹏矩阵”:全国司法行政AI大模型实现“0到1”的突破

  9 月28日,湛江市司法局举办AI渗透之城司法行政智能应用暨“鲲鹏矩阵”新闻发布会,通过成果展示、案例演示,全面呈现了“鲲鹏矩阵”这一司法行政综合垂直大模型的创新突破与实践成效,为全国...

高灯科技“数字农人”平台入选中国信通院“全景图”

高灯科技“数字农人”平台入选中国信通院“全景图”

  9月16日,2025数字生态发展大会暨“铸基计划”年中会议在北京召开。大会由中国互联网协会中小企业发展工委会主办,以“洞见十五五”为主题,汇聚众多行业领袖、技术专家与知名企业。会上,高...

DeepSeek遵循新规,AI生成内容添加明确标识以保用户知情权

DeepSeek遵循新规,AI生成内容添加明确标识以保用户知情权

  【TechWeb】在《人工智能生成合成内容标识办法》及相应国家标准于2025年9月1日起施行的大背景下,DeepSeek公司积极响应政策要求,发布了一项关于AI生成合成内容标识的重要公...

【华西计算机】0916 超越DeepSeek!豆包夺原生AI APP月活第一

【华西计算机】0916 超越DeepSeek!豆包夺原生AI APP月活第一

  QuestMobile最新发布的2025年8月数据显示,豆包月活跃用户规模超越DeepSeek,登顶中国原生AI App月活榜首。2025年8月,豆包月活跃用户规模达15742万,环比...

DeepSeek梁文锋论文登上Nature封面,AI大模型首次通过同行评审

DeepSeek梁文锋论文登上Nature封面,AI大模型首次通过同行评审

  发表 Editorial 文章称,DeepSeek R1 是首个通过权威学术期刊同行评审的大语言模型,并称此举“意义重大”,是朝着透明度和可重复性迈出的可喜一步。  ...