当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

2个月前 (02-26)Deepseek最新资讯170

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

联想AI终端全面接入DeepSeek满血大模型

联想AI终端全面接入DeepSeek满血大模型

e公司讯,记者获悉,联想集团旗下联想天禧个人智能体系统(天禧AS)中的小天个人智能体今天起已全面接入DeepSeek-R1联网满血版大模型。联想小天与DeepSeek联网满血版大模型的深度融合,实现响...

广东江门:举办DeepSeek大模型专题培训

广东江门:举办DeepSeek大模型专题培训

为帮助干部职工及时掌握前沿人工智能技术,提升数字化办公能力,近日,广东省江门市退役军人事务局举办DeepSeek大模型专题培训。培训会上,老师从DeepSeek简介、如何使用DeepSeek、Deep...

腾讯、华为等接入DeepSeek每月亏损超4亿

腾讯、华为等接入DeepSeek每月亏损超4亿

钛媒体App 2月19日消息,近日,腾讯、百度、华为、阶跃星辰等多家AI大模型企业接入DeepSeek-R1模型,使得“DeepSeek朋友圈”企业超过100家。尽管DeepSeek R1模型具备训练...

兰州大学上线DeepSeek本地服务

兰州大学上线DeepSeek本地服务

近日,兰州大学成功部署了由国产大模型公司深度求索(DeepSeek)推出的推理大模型DeepSeek-R1,目前已完成了数十款主流模型的部署工作,校内师生可通过高性能计算服务平台(https://hp...

医疗机构如何部署DeepSeek?这一专家共识给出参考→

医疗机构如何部署DeepSeek?这一专家共识给出参考→

近日,《医疗机构部署DeepSeek专家共识》在京发布,引起业界关注。该共识从医疗需求适配性、数据质量保障、伦理合规等5大维度提出系统性部署框架,以期为人工智能(AI)落地医疗场景提供标准化路径。该共...

普通人如何抓住deepseek红利

普通人如何抓住deepseek红利

普通人如何抓住deepseek红利?要抓住DeepSeek这类AI技术公司的红利,普通人可以从以下几个方向切入,结合自身资源和能力选择最适合的路径:一、成为技术应用的早期参与者抢先体验产品注册成为De...