当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

5个月前 (03-03)Deepseek最新资讯319

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

“调用量太大,经常造成网络拥堵”!DeepSeek推出新优惠,普通用户依然免费

“调用量太大,经常造成网络拥堵”!DeepSeek推出新优惠,普通用户依然免费

中国商报(记者 赵熠如)2月26日,DeepSeek宣布推出错峰优惠活动。即日起,北京时间每日00:30至08:30的夜间空闲时段,API(应用程序编程接口,通常用于应用开发)调用价格大幅下调:Dee...

李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU

李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU

第一家全面拥抱DeepSeek的“六小虎”,出现了!不卖关子,它就是李开复亲任CEO的零一万物。今日正式上线万智企业大模型一站式平台,宣布提供企业级DeepSeek部署定制解决方案。而早在今年2月11...

DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!

DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!

DeepSeek V3模型完成小版本升级后,李开复称其将中美AI差距缩小至3个月,某些领域中国甚至已经领先。中国人工智能初创企业DeepSeek近日发布其最新大语言模型DeepSeek-V3-0324...

中国电信助力宁德企业打造DeepSeek智能公文系统

中国电信助力宁德企业打造DeepSeek智能公文系统

数字化浪潮席卷千行百业,中国电信宁德分公司与福建省烟草公司宁德市公司紧密携手,从智慧大屏到智慧指挥中心,不断拓展企业数字化转型的深度与广度。近日,中国电信携手DeepSeek为宁德烟草注入全新动力,以...

山石网科发布DeepSeek大模型应用一体机解决方案

山石网科发布DeepSeek大模型应用一体机解决方案

每经快讯,据山石网科微信公众号3月3日消息,近日,山石网科发布DeepSeek大模型应用一体机解决方案,致力于为用户提供一站式“算力+大模型+安全应用”服务能力。山石网科股票山石网科发布deepsee...

DeepSeek智能体正在改变工作方式?学会这3招,提升你的职业竞争力

DeepSeek智能体正在改变工作方式?学会这3招,提升你的职业竞争力

你还在手动整理数据?还在为写不出高质量文案而苦恼?小心被AI淘汰!2024年,职场内卷已经到了白热化阶段。但比内卷更可怕的是什么?是降维打击!当别人用DeepSeek智能体几分钟搞定你一天的工作,你的...