当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

2.1亿!DeepSeek大单来了:300P算力、120台昇腾910C服务器

2.1亿!DeepSeek大单来了:300P算力、120台昇腾910C服务器

  智东西9月12日消息,9月9日,鄂尔多斯市点砾智算科技有限公司提交的鄂尔多斯市点砾智算中心建设项目准予备案。该项目总投资   项目公司拟建设300P的AI算力中心,包...

浪潮云海若一体机入选山东省首台(套)技术装备生产企业及产品名单

浪潮云海若一体机入选山东省首台(套)技术装备生产企业及产品名单

  近日,《2025年度山东省首台(套)技术装备生产企业及产品名单》正式发布,浪潮云海若一体机凭借领先的技术创新性、全栈国产化适配能力及行业场景落地价值成功入选。此次入选不仅是海若一体机在...

湛江首发“鲲鹏矩阵”:全国司法行政AI大模型实现“0到1”的突破

湛江首发“鲲鹏矩阵”:全国司法行政AI大模型实现“0到1”的突破

  9 月28日,湛江市司法局举办AI渗透之城司法行政智能应用暨“鲲鹏矩阵”新闻发布会,通过成果展示、案例演示,全面呈现了“鲲鹏矩阵”这一司法行政综合垂直大模型的创新突破与实践成效,为全国...

鸿蒙版QQ浏览器正式上架平板,五大AI能力全面上线,开启AI新体验

鸿蒙版QQ浏览器正式上架平板,五大AI能力全面上线,开启AI新体验

  近日,鸿蒙版QQ浏览器正式上架平板,带来与手机端一致的AI体验。QQ浏览器内置AI智能体QBot,支持AI搜索、AI浏览、AI办公、AI学习、AI写作五大AI能力,为鸿蒙平板用户带来“...

DeepSeek预测:切尔西VS水晶宫!蓝军主场碾压,恩佐+帕尔默双星闪耀!

DeepSeek预测:切尔西VS水晶宫!蓝军主场碾压,恩佐+帕尔默双星闪耀!

  2025-26赛季英超首轮焦点战,切尔西将在斯坦福桥迎战水晶宫deepseek。蓝军上赛季末豪取主场5连胜,而水晶宫客场已连续4场不胜。历史交锋中,切尔西近5战2胜3平保持不败,主场更...

DeepSeek-V3.1 上线火山方舟:无需注册登录即可免费体验

DeepSeek-V3.1 上线火山方舟:无需注册登录即可免费体验

  IT之家 8 月 23 日消息,火山引擎开发者社区公众号昨天宣布,DeepSeek-V3.1 正式上线火山方舟,企业用户可以在更快、更稳的资源保障下体验最新 DeepSeek-V3.1...