当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-24)Deepseek最新资讯264

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

华是科技:已成立人工智能部,在deepseek基础上进行行业应用测试

华是科技:已成立人工智能部,在deepseek基础上进行行业应用测试

金融界4月10日消息,有投资者在互动平台向华是科技提问:董秘您好,近期以deepseek为首的开源模型对贵公司产生了哪些实质影响?贵公司目前的订单如何?今年的业绩展望如何?公司回答表示:公司已成立人工...

中新天津生态城“城市大脑”全面接入DeepSeek

中新天津生态城“城市大脑”全面接入DeepSeek

人民网天津3月27日电 (记者孙翼飞)近日,中新天津生态城(下简称“生态城”)“城市大脑”完成DeepSeek(深度求索)大模型的私有化部署,实现与城市大脑的初步集成,标志着城市大脑智慧服务能力正式迈...

美财长称最近美股崩盘原因是DeepSeek而非特朗普的政策

美财长称最近美股崩盘原因是DeepSeek而非特朗普的政策

据环球时报援引路透社报道,在4月5日公开的一次采访中,美国财政部长贝森特将美股崩盘归咎于DeepSeek,而非特朗普的经济政策。...

怎么设置deepseek的快捷检索?

怎么设置deepseek的快捷检索?

怎么设置deepseek的快捷检索?要设置DeepSeek的快捷检索,您可以通过创建一个快捷指令来实现。以下是详细的步骤:下载并打开快捷指令App:在App Store中下载并安装“快捷指令”应用。创...

全民AI启蒙之后,DeepSeek向产业纵深处走去

全民AI启蒙之后,DeepSeek向产业纵深处走去

“DeepSeek比过去两年多以来,全行业对于用户的教育都要更加有效。”近日,谈及DeepSeek带来的变化,OPPO ColorOS系统设计总监陈希对第一财经感慨,一夜之间几乎全民都知道了什么是大模...

DeepSeek说:普通人如何应对美国关税冲击?

DeepSeek说:普通人如何应对美国关税冲击?

以下是应对美国关税战冲击的10条简明建议,结合多维度策略帮助普通人降低影响:1. 支持国货替代进口品减少对高价进口商品的依赖,优先选择国产电子产品、日用品和食品,降低消费成本的同时助力国内产业发展。2...