当前位置：首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布：编程数学能力接近Claude 3.7

6个月前 (03-25)DeepSeek技术交流419

DeepSeek于24日夜间发布V3模型小版本升级，新版本DeepSeek-V3-0324在模型参数上达到685B，并采用MIT许可证，为用户带来全新体验。该版本重点提升了数学和编程能力，性能接近Claude 3.7 Sonnet，且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型，原始参数为671B，每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B，采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月，优化了Function call功能，解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域，DeepSeek V3-0324展现出惊人实力。测试显示，其能在3分钟内完成750行电商网站代码，包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来，业界普遍认为仅Claude 3.5能够生成优质前端代码，而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面，V3-0324也表现出色，成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证，允许用户出于任何目的使用、修改和分发模型，包括商业用途。这一决策获得业内广泛关注，Perplexity CEO阿拉文德认为，DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署，仅需支付服务器费用，还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局，推动行业向更开放、更透明的方向发展。

本文源自：金融界

标签: DeepSeek 人工智能数据分析

返回列表

上一篇：从DeepSeek-R1看AI国产化的全球突围

下一篇：青青们快看过来，“青春来宾”携手DeepSeek让你的青春搭子24小时在线！

“DeepSeek V3升级版发布：编程数学能力接近Claude 3.7” 的相关文章

DeepSeek V3升级版发布：编程数学能力接近Claude 3.7

“DeepSeek V3升级版发布：编程数学能力接近Claude 3.7” 的相关文章

息壤+DeepSeek，湖南电信AI数字化产品矩阵重磅发布

DeepSeek梁文锋亲自挂名，公开新注意力架构NSA

中国电信舟山分公司：自研完成全市首个DeepSeek本地化应用，深度赋能社会救助数智化转型

新书来了 │ DeepSeek+万物=王炸，打工人效率如何翻倍？这4本书给你答案

DeepSeek API 的返回值格式是什么？

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.