当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

4个月前 (02-26)Deepseek最新资讯239

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

deepseek能为政务系统带来什么?

deepseek能为政务系统带来什么?

思考和行动过程用户希望了解DeepSeek为政务系统带来的具体价值。DeepSeek是一家专注于人工智能和大数据技术的公司,致力于提供高效的文本处理和信息检索解决方案。在政务系统领域,DeepSeek...

DeepSeek冲击下,孩子最需要哪些能力?

DeepSeek冲击下,孩子最需要哪些能力?

编者按:阅读,是用心灵探索未知、体味世界的一种方式,也是人们在面临困难、孤独、疾病、生死等障碍时寻求解决方案和慰藉的途径之一。有指导的阅读不仅能提高阅读效率,更可能让疗愈发生,更愉快地工作与生活。由新...

算力与算法共振:浪潮信息携 DeepSeek 推动无人机技术在舟山落地

算力与算法共振:浪潮信息携 DeepSeek 推动无人机技术在舟山落地

随着首届“凌海御空·舟山新篇”清华未来立体通行挑战赛在浙江舟山圆满落下帷幕,浪潮信息旗下的企业级大模型开发平台——元脑企智 EPAI 成为了赛事背后不可或缺的技术引擎。平台整合 CPU + GPU 多...

“财透”上半年·科技篇|DeepSeek概念股“冰火两重天”,9只翻倍牛股业绩大幅分化

“财透”上半年·科技篇|DeepSeek概念股“冰火两重天”,9只翻倍牛股业绩大幅分化

在2025年以来的资本市场上,以DeepSeek为核心的AI概念板块持续领跑。同花顺iFinD数据显示,截至4月30日,36只DeepSeek概念股年内涨幅超50%,其中年内股价翻倍的个股有9只,分别...

创新驱动 智领未来 山东移动DeepSeek高教共创沙龙举办

创新驱动 智领未来 山东移动DeepSeek高教共创沙龙举办

在科技飞速发展的当下,人工智能技术正以前所未有的速度重塑高等教育发展格局。为深入探索人工智能与高等教育的融合创新路径,3月27日,山东移动携手华为在青岛举办以“创新驱动 智领未来”为主题的DeepSe...

AI使用趋势报告:DeepSeek使用率急挫 快手Kling急速掘起

AI使用趋势报告:DeepSeek使用率急挫 快手Kling急速掘起

Poe发布2025年春季人工智能(AI)模型使用趋势报告显示,其中DeepSeek R1使用率由2月峰值7%,降至4月底的3%,因面对竞争对手相继涌现;OpenAI的GPT-4.1及Google的Ge...