当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

8小时前Deepseek最新资讯36

  昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后deepseek,在 Hugging Face 发布了一款新模型

  从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

  该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!

  整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。原文出处:DeepSeek开源新基础模型,但不是V4,而是V3.1-Base,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源新基础模型,但不是V4,而是V3.1-Base” 的相关文章

刚刚,北大DeepSeek斩获ACL 2025最佳论文!全网首发一作演讲,稀疏注

刚刚,北大DeepSeek斩获ACL 2025最佳论文!全网首发一作演讲,稀疏注

  2025年ACL盛会于维也纳落下帷幕!今年会议规模空前,投稿量超过8000篇,其中超半数作者来自中国。4篇最佳论文中,出自中国团队之手的同样占到50%——分别是北大与DeepSeek合...

DeepSeek母公司总监套取券商上亿佣金

DeepSeek母公司总监套取券商上亿佣金

  【#DeepSeek母公司总监套取券商上亿佣金#】近日,国内顶级量化私募机构幻方量化陷入一场牵涉金额高达1.18亿元的返佣案件。据21记者此前报道,去年11月,幻方量化市场总监李橙因涉...

就说换做你是特根,离队这事怎么处理?

就说换做你是特根,离队这事怎么处理?

  我觉得我会今年先申请租借如果可以的话,手握两年合同世界杯后还想拼就离队,不想拼就躺着拿钱,按照刚开始报道俱乐部应该能接受特狮租借离队   我觉得我...

渤海人寿7.8纪实:爱与责任 守护美好

渤海人寿7.8纪实:爱与责任 守护美好

  2025年“7.8 全国保险公众宣传日”期间,渤海人寿秉持金融工作的政治性、人民性,以“爱和责任 保险让生活更美好”为主题,全面开展7.8系列宣传与文化推进活动。从红色文化活动开展、保...

梁文锋论文获奖,DeepSeek V4真要来了?

梁文锋论文获奖,DeepSeek V4真要来了?

  【梁文锋论文获奖,DeepSeek V4真要来了?】 #梁文锋##deepseek##超级AI工厂##大模型# DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论...

郑州市第二十二届职工技术运动会DeepSeek创新应用技能竞赛决赛开幕

郑州市第二十二届职工技术运动会DeepSeek创新应用技能竞赛决赛开幕

  8月6日上午,由郑州市总工会主办,郑州市电子信息科技工会、郑州市信息协会和河南中维信创大数据研究院承办的“郑州市第二十二届职工技术运动会DeepSeek创新应用技能竞赛”在郑东新区龙子...