当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

2个月前 (07-10)Deepseek应用场景211

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

郑州市DeepSeek创新应用技能竞赛邀您来赛

郑州市DeepSeek创新应用技能竞赛邀您来赛

即日起至8月1日,“数智赋能·创见未来”郑州市第二十二届职工技术运动会DeepSeek创新应用技能竞赛开始报名了!此次竞赛由郑州市总工会主办,郑州市电子信息科技工会和市信息协会共同承办,旨在加快培养高...

DeepSeek R1 新版幻觉最高降低 50%

DeepSeek R1 新版幻觉最高降低 50%

DeepSeek R1 新版幻觉最高降低 50%昨日,DeepSeek R1 模型正式完成小版本升级,目前版本为「DeepSeek-R1-0528」。据介绍,DeepSeek-R1-0528 仍然使用...

外服控股:公司AI智能助手“云知道”已接入DeepSeek-R1

外服控股:公司AI智能助手“云知道”已接入DeepSeek-R1

证券之星消息,外服控股(600662)07月17日在投资者关系平台上答复投资者关心的问题。投资者:为评估公司价值,请说明1.是否在办公、研发、客户服务或业务流程中应用AI技术?(a)是(b)否2.若应...

DeepSeek全攻略:入门到精通附讲解视频本地电脑部署教程

DeepSeek全攻略:入门到精通附讲解视频本地电脑部署教程

【好课推荐】DeepSeek全攻略:入门到精通附讲解视频本地电脑部署教程 在当今数字化时代,人工智能技术飞速发展,深度学习更是成为了热门领域。DeepSeek作为一款强大的工具,为深度学习爱...

国泰集团接入DeepSeek大模型

国泰集团接入DeepSeek大模型

国泰集团接入DeepSeek大模型金融研究中心07月01日讯,有投资者向603977/ >国泰集团(603977)提问, 贵司控股子公司江西国泰利民信息科技有限公司的信息化业务是否接入了deep...

DeepSeek 热潮半年之后,医生、教师、程序员,谁好评,谁差评?

DeepSeek 热潮半年之后,医生、教师、程序员,谁好评,谁差评?

2025年年初,DeepSeek迎来爆发式发展,从技术突破到应用落地,AI 技术的发展深刻影响了多个行业的变革节奏。我们站在年中这个时间点上回望, AI 究竟如何影响了千行百业?腾讯新闻联合九派新闻、...