当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

3个月前 (03-25)DeepSeek技术交流249

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

Deepseek回应Manus横空出世:我要展示自信,AI的目标是拓展而非取代人类

Deepseek回应Manus横空出世:我要展示自信,AI的目标是拓展而非取代人类

3月6日凌晨,全球第一款通用AI智能体Manus震撼发布,发布4小时后,其官网的访问量突破千万量级,一夜之间刷爆“科技圈”。有人认为,Manus有望成为继DeepSeek后的最大黑马。那么,DeepS...

企业微信接入 DeepSeek 模型,支持智能机器人、智能表格

企业微信接入 DeepSeek 模型,支持智能机器人、智能表格

IT之家 2 月 21 日消息,企业微信今日宣布接入 DeepSeek 模型,带来了「智能机器人」、「智能表格-客户跟进总结」等 AI 功能。IT之家从官方介绍获悉,接入 DeepSeek、混元等大模...

陕西多所高校正式接入DeepSeek 为师生提供智能化个性化服务

陕西多所高校正式接入DeepSeek 为师生提供智能化个性化服务

近期,陕西多所高校纷纷将人工智能平台与DeepSeek对接,为师生提供从科研助手到智能辅助教学,从跨学科资源整合到校园生活助手等一系列智能化、个性化服务。西安交大“交小智”可让师生创建专属AI应用20...

车企“抢滩”DeepSeek背后:角力智能座舱,降低投资成本

车企“抢滩”DeepSeek背后:角力智能座舱,降低投资成本

DeepSeek掀起的技术革命正在席卷汽车行业。截至目前,超过20家车企宣布接入DeepSeek模型,涵盖了比亚迪、吉利、奇瑞、岚图、长城、理想汽车等主流品牌。这一情况与2023年ChatGPT爆火时...

青海移动完成基于国产化算力的DeepSeek模型部署

青海移动完成基于国产化算力的DeepSeek模型部署

中国移动通信集团青海有限公司基于寒武纪MLU 590国产化算力资源池,已全面部署上线DeepSeek国产化大模型服务,实现了全版本覆盖、全尺寸适配、全功能畅用,全方位加入DeepSeek生态圈。【新华...

探索文艺与科技融合!湖北文艺家上了一堂DeepSeek应用课

探索文艺与科技融合!湖北文艺家上了一堂DeepSeek应用课

AI、AGI、GAI、AIGC的概念有什么不同?怎样清晰地给DeepSeek发出指令?美化PPT有哪些好用的软件……3月7日,湖北省文联举办的《DeepSeek等人工智能工具在文艺领域的应用与实践》讲...