当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

7个月前 (02-24)Deepseek最新资讯353

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

按下AI产业发展“加速键”,湖北移动全面加快DeepSeek部署

按下AI产业发展“加速键”,湖北移动全面加快DeepSeek部署

今年以来,国产AI大模型DeepSeek热度持续攀升,引发国资央企新一轮合作热潮,近日,记者从中国移动湖北公司获悉,在武汉光谷未来科技城——中国移动大模型产业创新基地(湖北),依托九天大模型MaaS平...

泉州出台工作方案!事关DeepSeek技术应用→

泉州出台工作方案!事关DeepSeek技术应用→

为深入贯彻党中央、国务院关于推动人工智能发展的战略部署,加快推动深度求索(DeepSeek,以下简称DS)技术在我市政务、产业等领域的应用,以人工智能、大数据技术赋能政务提质增效、产业转型升级,泉州出...

联想AI终端全面接入DeepSeek满血大模型

联想AI终端全面接入DeepSeek满血大模型

e公司讯,记者获悉,联想集团旗下联想天禧个人智能体系统(天禧AS)中的小天个人智能体今天起已全面接入DeepSeek-R1联网满血版大模型。联想小天与DeepSeek联网满血版大模型的深度融合,实现响...

微信接入DeepSeek后,谁赢麻了

微信接入DeepSeek后,谁赢麻了

在未来,普通人体验满血版DeepSeek最简单的方式,可能就是打开微信。2月15日,有网友发现微信接入了DeepSeek-R1模型。2月16日,媒体记者在向腾讯集团求证后,证明了上述消息的真实性。有人...

腾讯游戏《和平精英》接入DeepSeek

腾讯游戏《和平精英》接入DeepSeek

中证报中证网讯(记者 王辉)腾讯旗下战术竞技手游《和平精英》2月21日宣布,将接入DeepSeek,为数字代言人“吉莉”注入人工智能。根据计划,2月25日将开启灰度测试,并在短期内面向全量用户开放。由...

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

2月24日,中电万维应兰州市数据局要求,将DeepSeek人工智能大模型接入兰州市政府门户网站,打造DeepSeek在兰州市的首个应用场景。万维迅速组建DeepSeek专项协同攻坚队,55小时内圆满完...