当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

3个月前 (03-27)DeepSeek技术交流205

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

2025年DeepSeek一体机:热潮下的机遇与挑战

2025年DeepSeek一体机:热潮下的机遇与挑战

2025年DeepSeek一体机:热潮下的机遇与挑战2025年伊始,DeepSeek大模型引领的一体机热潮如狂风般席卷中国AI市场。这款一体机凭借“开箱即用”的便捷特性以及超低的准入门槛,迅速吸引了众...

鑫元基金已完成DeepSeek私有化部署

鑫元基金已完成DeepSeek私有化部署

国内领先的自主可控大模型DeepSeek横空出世,其开源生态吸引了众多开发者和企业的参与,通过在多行业的广泛应用,形成了丰富的应用场景和解决方案。公募基金行业也未缺席,不少基金公司已在尝试部署这一大模...

大火、环保、核电与DeepSeek,欧洲对AI追赶之道的思考

大火、环保、核电与DeepSeek,欧洲对AI追赶之道的思考

这是2月10日在法国巴黎大皇宫拍摄的人工智能行动峰会现场。新华社 图巴黎的大皇宫,是法国为了1900年的世博会而专门修建的。当时的法国,还处在美好年代的顶峰,是数一数二的世界强国,也是科技大国。一百多...

安卓首家接入DeepSeek背后:看见女性力量

安卓首家接入DeepSeek背后:看见女性力量

在人类社会的历史进程中,女性的力量从来不容小觑,她们以不同的方式在各个领域诠释着自身价值。今天,我们将目光投向科技领域:中国科技部最新统计显示,我国女性科技工作者总量达4260万人,在科研人员总量中占...

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

当警用无人机遇上人工智能会擦出怎样的火花?在郑州街头一场由"无人机+DeepSeek"引领的交通变革正在悄然上演从空中侦察员、安全宣讲员,到事故调解员再到智能调度师郑州交警正在逐步...

探索文艺与科技融合!湖北文艺家上了一堂DeepSeek应用课

探索文艺与科技融合!湖北文艺家上了一堂DeepSeek应用课

AI、AGI、GAI、AIGC的概念有什么不同?怎样清晰地给DeepSeek发出指令?美化PPT有哪些好用的软件……3月7日,湖北省文联举办的《DeepSeek等人工智能工具在文艺领域的应用与实践》讲...