当前位置:首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

2个月前 (08-12)Deepseek最新资讯244

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

  从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

  在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

  按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

  此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

  据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

  据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。原文出处:基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布,感谢原作者,侵权必删!

标签: deepseek

“基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布” 的相关文章

DeepSeek-V3.1 上线火山方舟:无需注册登录即可免费体验

DeepSeek-V3.1 上线火山方舟:无需注册登录即可免费体验

  IT之家 8 月 23 日消息,火山引擎开发者社区公众号昨天宣布,DeepSeek-V3.1 正式上线火山方舟,企业用户可以在更快、更稳的资源保障下体验最新 DeepSeek-V3.1...

顺钠股份:未与DeepSeek进行合作研发

顺钠股份:未与DeepSeek进行合作研发

  金融界8月8日消息,有投资者在互动平台向顺钠股份提问:贵公司是否通过子公司顺特电气和deepseek进行了合作研发等相关设计?是否有液冷方面的产品设备正在开发调试或者测试中?...

免费使用!腾讯地图已接入DeepSeek-V3.1

免费使用!腾讯地图已接入DeepSeek-V3.1

  2025年8月21日,DeepSeek 正式发布并开源最新版本 DeepSeek V3.1。腾讯地图同步宣布,已率先完成该版本的接入,旗下 AI 出行助手「AI 叮当」在思考效率、上下...

DeepSeek梁文锋论文登《自然》封面,回应模型蒸馏质疑

DeepSeek梁文锋论文登《自然》封面,回应模型蒸馏质疑

  #智见科技快讯 DeepSeek梁文锋论文登《自然》封面,文章正面回应模型发布之初的蒸馏质疑deepseek。Nature:这一空白“终于被DeepSeek打破”#新华智见原文出处:D...

DeepSeek登《Nature》封面,梁文锋带队首次回应“蒸馏”争议

DeepSeek登《Nature》封面,梁文锋带队首次回应“蒸馏”争议

  9月18日,属于中国人工智能的又一个高光时刻来到了。DeepSeek再次引发轰动。由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊...

“涨价潮”来袭:DeepSeek领涨,国产大模型告别价格战?

“涨价潮”来袭:DeepSeek领涨,国产大模型告别价格战?

  上周,深度求索(DeepSeek)正式推出DeepSeek-V3.1大语言模型,并宣布自9月6日起调整API定价并取消夜间优惠。根据最新定价策略,输入部分在缓存命中时为0.5元/百万t...