当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

5个月前 (02-26)DeepSeek技术交流367

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

DeepSeek回应两会走红:嘿嘿,怪不好意思的

DeepSeek回应两会走红:嘿嘿,怪不好意思的

这两天,谁要是不说说DeepSeek,好像就不太时髦了。全国两会期间, DeepSeek太火。从大会发言人、部长们的点赞,到代表委员们的热议,DeepSeek参与掀起的“人工智能+”浪潮席卷而来,中国...

浦东头部企业纷纷接入DeepSeek大模型!“人工智能+”在千行百业加快应用

浦东头部企业纷纷接入DeepSeek大模型!“人工智能+”在千行百业加快应用

“deepseek的出现,标志着ai进入‘效率革命’的阶段,开辟了在垂直领域深度赋能的新战场,推动行业竞争焦点从‘参数竞赛’转向‘成本控制与场景适配’。”深耕人工智能领域多年的极豆科技ceo汪奕菲在本...

省厅举办首期DeepSeek应用专题培训班

省厅举办首期DeepSeek应用专题培训班

为积极响应国家数字化转型战略号召,深度推动人工智能技术在交通运输领域的创新融合与高效落地,4月28日,省交通运输厅精心筹备并成功举办了第一期DeepSeek人工智能应用专题培训班。此次培训吸引了来自厅...

三星Galaxy S25系列接入DeepSeek:支持深度思考

三星Galaxy S25系列接入DeepSeek:支持深度思考

2025年以来,伴随着DeepSeek开源,一众科技公司纷纷接入该大模型,以补足AI能力短板。近日,三星也官宣,三星Galaxy S25系列正式接入DeepSeek-R1大模型。据了解,三星Galax...

DeepSeek红利耗尽后,元宝拿什么和豆包斗?

DeepSeek红利耗尽后,元宝拿什么和豆包斗?

原创 赵晋杰 字母榜短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧...

这场科技盛会将启幕,为何DeepSeek让业内兴奋又“焦虑”

这场科技盛会将启幕,为何DeepSeek让业内兴奋又“焦虑”

“这次DeepSeek横空出世,让AI从业者既兴奋又‘焦虑’。”上海库帕思科技有限公司CEO黄海清认为,DeepSeek最核心的点在于技术创新,为中国大模型公司和产业的发展提供了一个较好的“换道超车”...