当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?

5个月前 (05-29)DeepSeek技术交流419
DeepSeek低调升级,引发科技圈热议。
5月28日,DeepSeek 在官方微信群发布消息称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。
不过,澎湃新闻记者查询官方网站等,发现没有对此次更新的详细信息。记者咨询了一位DeepSeek内部人士,对方回复称是“小升级”。
根据Hugging Face,DeepSeek-R1此次开源版本为0528。
从宣传来看,此次升级十分低调,不过,根据网友测评,此次升级可不是简单的“小升级”。
有科技媒体分析称,时隔4个月,DeepSeek-R1完成了超进化,编码能力强到离谱,而且思考时间更长了。据称,新模型基于DeepSeek-V3-0324训练(参数为660B)。在LiveCodeBench基准上,DeepSeek-R1-0528性能几乎与o3-mini(High)和o4-mini(Medium)实力相当,一举超越了Gemini 2.5 Flash。
科技类网站“AIGC开放社区”的评论称,在著名代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多。
从社交媒体的反馈来看,网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。
此外,有网友通过实验对比了Claude-4-Sonnet与DeepSeek-R1-0528的实际表现。可以看到,DeepSeek-R1生成的代码在模拟物理碰撞方面表现更好。
值得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。
有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,当时有内部人士向记者坦言,该传言真实度不高。从目前的情况分析,DeepSeek或许将用此次R1版本的升级,取代R2版本的推出。
尽管网友评测得出的结论十分惊喜,但是也有业内人士向记者表示,建议理性客观看待,也期待更为权威的测评结果。
在DeepSeek R1发布更新后,远在大洋彼岸的AI巨头英伟达(Nasdaq:NVDA)发布截至4月27日的2026财年第一财季财报,期内实现营收440.62亿美元,同比上涨69%,高于市场预期的432.8亿美元;美国通用会计准则(GAAP)下净利润187.75亿美元,同比上涨26%。在财报电话会上,英伟达CEO黄仁勋再次谈到DeepSeek所引发的市场对于推理模型的关注,以及推理模型会需要更大的算力支持,这将驱动推理算力需求。
澎湃新闻记者 范佳来


“DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?” 的相关文章

李国杰院士“七问”DeepSeek都说了些什么?

李国杰院士“七问”DeepSeek都说了些什么?

近日,DeepSeek的横空出世,在全球科技领域激起千层浪,引发了从学界到业界的广泛热议与深度思考。《科技导报》2025年第3期刊发李国杰院士的《DeepSeek引发的AI发展路径思考》一文,深入剖析...

AI培训赋能加力!甘肃3000余名公共法律服务工作者接受人工智能专题培训

AI培训赋能加力!甘肃3000余名公共法律服务工作者接受人工智能专题培训

法律服务遇上“大数据”“硬科技”怎么办?3月22日,甘肃省司法厅举办人工智能(Deepseek)助力全省公共法律服务发展专题培训会,积极适应人工智能时代发展新要求,切实提升人工智能(Deepseek)...

微信小程序使用DeepSeek的方法有哪些?

微信小程序使用DeepSeek的方法有哪些?

大家好,我是沐颜,专注私域流量变现。我的陪跑项目👉🏻 《超级个体合伙人》我的网创资源站👉🏻《搞钱项目资源》每天分享靠谱的副业项目,感兴趣的朋友,可以点个关注。设定清晰的目标是成功的第一步。当你知道自己...

光大理财本地化部署DeepSeek,智驭未来,开启智能金融新篇章

光大理财本地化部署DeepSeek,智驭未来,开启智能金融新篇章

在数字经济与实体经济深度融合的当下,金融行业正经历着从“经验驱动”向“数据驱动”的深刻转型。光大理财,作为国内首批银行理财子公司,始终秉持“科技为舟”的战略,积极探索从“数字化”到“数智化”的进阶之路...

建筑业真要洗牌了!中建三局已应用DeepSeek管理工程,取代人力更高效!

建筑业真要洗牌了!中建三局已应用DeepSeek管理工程,取代人力更高效!

源自丨中建三局近日,中央广播电视总台《新闻直播间》栏目播出《科技推动力·大模型“智”在何方》特别策划,其中1分多钟重点报道了中建三局系列平台产品创新应用AI大模型,为建筑业提供更多“数字方案”,探访揭...

锚定“技术+场景”融合|中国电信新疆吐鲁番分公司成功举办DeepSeek大模型应用交流论坛

锚定“技术+场景”融合|中国电信新疆吐鲁番分公司成功举办DeepSeek大模型应用交流论坛

当DeepSeek大模型技术遇上丝绸之路明珠,会碰撞出怎样的火花?近日,中国电信新疆吐鲁番分公司以“智创未来·共赢发展”为主题,成功举办DeepSeek人工智能大模型交流论坛。活动汇聚各单位机构、行业...