当前位置:首页 > Deepseek最新资讯 > 正文内容

中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用

3小时前Deepseek最新资讯13

  8月21日,深度求索正式发布并开源DeepSeek-V3.1,采用混合推理架构,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。从性能来看:1)编程:V3.1在Aider编程基准测试中取得71.6%高分deepseek,“霸榜”开源模型、超越Claude Opus 4,同时推理和响应速度更快;2)SVGBench:实力仅次于GPT-4.1-mini,远超前代DeepSeek R1;3)MMLU:在多任务语言理解方面,V3.1的表现毫不逊色于GPT-5,得分达到88.5%。

  1)更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

  2)思考效率更高效:相同性能下输出token减少,降低推理成本。根据深度求索团队测试结果,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

  3)持续保持API价格优势,单次编程任务仅需1.01美元,为专有系统的1/60。V3.1输入价格为0.5元/百万tokens (缓存命中) ,4元/百万tokens (缓存未命中) ;输出价格为12元/百万tokens。

  1)UE8M0 FP8精度格式具备更小带宽、更低功耗和更高吞吐的优势。根据算力豹,UE8M0采用无符号、8位指数、0位尾数的设计,在相同硬件下可降低显存需求高达75%;更适合微缩放场景,减少量化误差;更低的内存和计算需求意味着数据中心的运营成本下降。

  2)下一代国产芯片积极沿用FP8精度,有望形成国产芯片生态圈,提高算力利用率。根据通信世界,寒武纪最新一代MLU370-S4、思元590与690系列均已支持FP8计算;海光、沐曦、中昊芯英、摩尔线程等厂商均有芯片支持FP8;此外,华为昇腾虽在当前版本(910B/910C)尚未开放FP8,但路线图已明确“2025Q4原生FP8”。

  3)我们认为,UE8M0 FP8参数精度的发布,代表着国产AI正走向软硬协同阶段,能够实质性减少对英伟达、AMD等国外算力的依赖,更加凸显国产芯片在AI大时代的竞争力。

  1)国产算力:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信、华丰科技、神州数码、软通动力、烽火通信、广电运通、拓维信息、四川长虹;

  2)AI Agent:鼎捷数智、泛微网络、致远互联、金蝶国际、用友网络、汉得信息、赛意信息、迈富时、光云科技、税友股份、润达医疗、同花顺、恒生电子、金山办公、万兴科技、福昕软件、科大讯飞、金桥信息、卓易信息、普元软件等。原文出处:中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用,感谢原作者,侵权必删!

标签: deepseek

“中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用” 的相关文章

DeepSeek模型升级至V3.1,上下文长度达128k

DeepSeek模型升级至V3.1,上下文长度达128k

  重磅:DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至128kdeepseek,API接口调用方式保持不变。   近期DeepSeek更新聚焦实用性...

事事关心 | “智能时代 同球共济” 中国发起倡议

事事关心 | “智能时代 同球共济” 中国发起倡议

  凭借多年的搜索与大模型技巧积累,坚持破和立的辩证统一,坚持革新和开放相统一,当时,习总揭橥首要讲话,一年来,切实做到“直面抵触问题不逃避,又一场会议。   百度在意图...

Deepseek推荐全国旅游百强区第8名:浙江杭州市西湖区

Deepseek推荐全国旅游百强区第8名:浙江杭州市西湖区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

2025年度AI创新应用DeepSeek

2025年度AI创新应用DeepSeek

  【#2025年度AI创新应用DeepSeek#】在上海举办的#2025中国AI盛典#中,年度AI创新应用正式揭晓——DeepSeek!作为首个全开源策略的应用,它能写代码、解难题、创诗...

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

  它采用了全新的混合推理架构,让模型能在一个统一框架内支持「思考」与「非思考」两种模式。V3.1 通过训练后优化,在工具使用与编程、搜索等智能体任务上表现均获得了较大提升。...

清华学者Nature Medicine发文:DeepSeek狂奔,已在近800家

清华学者Nature Medicine发文:DeepSeek狂奔,已在近800家

  DeepSeek-R1 成为美国苹果应用商店下载量最高的聊天机器人,超越了 OpenAI 的 ChatGPT。与相比,DeepSeek-R1 在效率、成本和透明度方面具有优势,一度导致...