当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

2个月前 (03-19)Deepseek应用场景150

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

百度AI搜索——不限量稳定使用DeepSeek-R1满血联网版

百度AI搜索——不限量稳定使用DeepSeek-R1满血联网版

百度AI搜索——不限量稳定使用DeepSeek-R1满血联网版AI搜索已接入满血联网版Deepseek-R1,一键开启深度思考,即可免费使用最新版Deepseek-R1完成各类推理任务。...

北京首个!顺义基础教育领域部署DeepSeek大模型

北京首个!顺义基础教育领域部署DeepSeek大模型

据北京顺义区消息,近日,顺义在北京市基础教育领域率先部署DeepSeek-R1人工智能大模型,以人工智能促进教育高质量发展,开启顺义智慧教育新篇章。顺义教委相关负责人表示,DeepSeek在教育领域的...

DeepSeek-R1内心世界首次曝光!AI显微镜破解R1大脑神秘推理机制

DeepSeek-R1内心世界首次曝光!AI显微镜破解R1大脑神秘推理机制

【新智元导读】推理模型与普通大语言模型有何本质不同?它们为何会「胡言乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek-R1模型,为我们提供了一把「A...

厦大夜校新开DeepSeek课程!还有这些课程……

厦大夜校新开DeepSeek课程!还有这些课程……

厦大老师开讲DeepSeek 智享生活。思明星光夜校揭牌。  厦门大学夜校又上新了!昨晚,厦门大学继续教育学院与共青团厦门市思明区委员会合作框架协议签约仪式暨“思明星光夜校——厦门大学2025年春季夜...

DeepSeek教学成果培育专题工作坊在烟台文化旅游职业学院举办

DeepSeek教学成果培育专题工作坊在烟台文化旅游职业学院举办

4月25日至27日,烟台文化旅游职业学院举办2025年DeepSeek赋能教学成果培育、凝练、申报实务与案例解析专题工作坊(第一期)。活动由山东省职业教育和产业人才研究院主办,我院承办。山东省职业教育...

中国石化完成全尺寸DeepSeek国产化部署

中国石化完成全尺寸DeepSeek国产化部署

2月14日,界面新闻从中国石化新闻办获悉,自国产深度推理大模型DeepSeek发布以来,中国石化组建了专门的模型部署和测评团队,2月5日完成DeepSeek在国产化算力环境上的部署,并接入长城大模型应...