当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

1个月前 (03-27)DeepSeek技术交流122

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

DeepSeek你不要太爱普洱了

DeepSeek你不要太爱普洱了

今年春节中国AI公司深度求索开发的大模型DeepSeek火爆“出圈”今天让我们以“旅居”角度对话DeepSeek去看看它眼中旅居普洱是什么样的吧DeepSeek笔下的普洱对话DeepSeek解锁旅居普...

DeepSeek有哪些优势和不足之处呢

DeepSeek有哪些优势和不足之处呢

DeepSeek的优势和不足之处具体如下:优势性能卓越:语言理解能力强:在多项权威测试中表现出色,能准确把握复杂语句含义。语言生成能力佳:生成的文本自然流畅、逻辑连贯,且生成速度快,每秒可以生成60个...

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File)...

北京大学联合华为发布全栈开源 DeepSeek 推理方案

北京大学联合华为发布全栈开源 DeepSeek 推理方案

IT之家 3 月 10 日消息,据华为技术有限公司和北京大学高性能计算校级公共平台消息,2025 年 3 月 9 日,北京大学联合华为发布 DeepSeek 全栈开源推理方案。据介绍,该方案...

新书来了 │ DeepSeek+万物=王炸,打工人效率如何翻倍?这4本书给你答案

新书来了 │ DeepSeek+万物=王炸,打工人效率如何翻倍?这4本书给你答案

2025年伊始,DeepSeek以数字笔墨掀起惊澜,也呈现了人工智能时代一个深刻的命题:当技术无限逼近人类自身能力的时候,是否会替代人类?很多话题的探讨甚至引发对社会安全稳定和伦理问题的担忧。AI看似...

山石网科:公司内部已经部署了DeepSeek

山石网科:公司内部已经部署了DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...