当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

7个月前 (03-19)Deepseek应用场景419

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

DeepSeek+水利 治水迎“智”变

DeepSeek+水利 治水迎“智”变

今年以来,随着以DeepSeek为代表的人工智能技术向垂直领域加速渗透,水利行业也迎来新一轮技术应用变革。目前,全省水利系统正积极开展“DeepSeek+水利”的相关应用,除了已经上线“DS都江堰”智...

刘磅带您云参观达实智能大厦:AIoT+DeepSeek如何提升市场部客户接待体验?

刘磅带您云参观达实智能大厦:AIoT+DeepSeek如何提升市场部客户接待体验?

刘磅带您云参观达实智能大厦: AIoT + DeepSeek如何提升市场部客户接待体验?###  借助国产AI大模型发展趋势,达实AIoT智能物联网管控平台升级到了V7版本,展示了生成式AI在园区数字...

趣生活 | DeepSeek眼中的陕西女性,原来是这样的~

趣生活 | DeepSeek眼中的陕西女性,原来是这样的~

“来自东方的神秘力量”“大模型圈的大黑马”“它真的好懂”“双商在线,是我目前用过最好的AI”日前“DeepSeek”登上热搜第一DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自...

专访学而思CTO田密:接入DeepSeek改变的不只是产品

专访学而思CTO田密:接入DeepSeek改变的不只是产品

开源的DeepSeek大模型火了,在线教育行业也因此卷起千层浪花。近期,学而思、网易有道、中公教育、猿辅导、作业帮等头部企业密集宣布接入DeepSeek大模型,这引发了业界广泛关注。DeepSeek为...

辽宁省疾控中心接入DeepSeek 提高疾控精准性时效性

辽宁省疾控中心接入DeepSeek 提高疾控精准性时效性

近日,省疾病预防控制中心正式宣布接入DeepSeek,成为东北地区首家引入AI技术全面赋能公共卫生管理的省级疾控机构,为我省疾病预防控制战线和智慧疾控建设赋予全新内驱力。目前,省疾病预防控制中心已初步...

普通人如何逃离DeepSeek幻觉陷阱

普通人如何逃离DeepSeek幻觉陷阱

DeepSeek横空出世,我们和人工智能的关系也随之进入新时代。但对于许多人来说,与AI的蜜月期还没有结束,幻觉问题就不合时宜地来预警。近期一条“80后死亡率突破5.2%”的假新闻广为流传,据上海网络...