当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日发布高性能通用矩阵乘法库

7个月前 (02-26)Deepseek最新资讯400

新京报贝壳财经讯（记者罗亦丹）北京时间2月26日，DeepSeek进行了其开源周第三日的发布——DeepGEMM，一个支持密集和MoE（专家混合模型）GEMM（通用矩阵乘法）的FP8 （8位浮点数）GEMM库，为V3/R1训练和推理提供支持。

据了解，通用矩阵乘法是许多高性能计算任务的核心，所以其性能优化也是大模型降本增效的重点。

DeepSeek表示，DeepGEMM在Hopper GPU（一种英伟达GPU架构）上最高可达到1350+FP8TFLOPS（每秒万亿次浮点运算），并且像教程一样简洁，可完全即时编译，其核心逻辑只有约300行代码，且在大多数矩阵尺寸上均优于专家调优的内核，并支持密集布局和两种MoE布局。

标签: DeepSeek

返回列表

上一篇：DeepSeek单日处理量等于镇江全市公务员10年工作量，为何有争议？

下一篇：DeepSeek已经给儿童看病了业内：“D医生”不为建议担责

“DeepSeek开源周第三日发布高性能通用矩阵乘法库” 的相关文章

“内置DeepSeek”，日媒：AI成中国汽车新卖点

“内置DeepSeek”，日媒：AI成中国汽车新卖点

东风日产的N7电动汽车将搭载DeepSeek凤凰网科技讯北京时间3月24日，据《日经亚洲》报道，中国汽车公司正在将DeepSeek的AI功能添加到旗下车型中，以便在中国这个全球最大汽车市场中脱颖而出...

DeepSeek创始人梁文锋入选《时代》周刊公布的“2025年全球最具影响力100人”

DeepSeek创始人梁文锋入选《时代》周刊公布的“2025年全球最具影响力100人”

上证报中国证券网讯近日，美国《时代》周刊公布了2025年百大人物。榜单信息显示，DeepSeek创始人梁文锋入选了该杂志“2025年全球最具影响力100人”榜单。《时代》周刊如此评价道：通过更高效地...

DeepSeek之后，百度再一次拉高AI势能

DeepSeek之后，百度再一次拉高AI势能

AI产业从“技术神话”走向“工程实用”。在DeepSeek引发的AI大模型成本革命和开源生态冲击下，互联网科技大厂正经历从技术理想主义向工程实用主义的转型。这是一个“祛魅”过程，不仅涉及技术路径的调整...

拥抱人工智能 DeepSeek应用专题培训会成功举办

拥抱人工智能 DeepSeek应用专题培训会成功举办

3月18日下午，由滨海新区区委区级机关工委、区委网信办、区数据局共同主办，区级机关工会联合会承办的DeepSeek应用专题培训会召开。培训聚焦“人工智能领域前沿技术的认知与DeepSeek操作应用能力...

四川自贡举行小学科学教学研讨会教师将AI数字人、DeepSeek融入课堂

四川自贡举行小学科学教学研讨会教师将AI数字人、DeepSeek融入课堂

5月16日，自贡市2024-2025学年下学期小学科学教学研讨会，在自贡市汇东实验学校成功举办。本次活动以“深耕科学课堂，点燃创新梦想”为主题，通过教学研讨与校园科技节双线并行，展现科学教育实践成果，...

华为鸿蒙电脑接入DeepSeek；AI PC产业链加速成熟

华为鸿蒙电脑接入DeepSeek；AI PC产业链加速成熟

在人工智能技术持续迭代的背景下，电子行业正迎来新一轮技术融合与终端创新。华为首款鸿蒙电脑通过接入DeepSeek与盘古大模型，实现了模型与芯片的深度协同；与此同时，AIPC产业链在硬件、生态与市场需求...