当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

6个月前 (03-27)DeepSeek技术交流391

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平

探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平

在大语言模型 (LLM) 的研究中,与以 Chain-of-Thought 为代表的逻辑思维能力相比,LLM 中同等重要的 Leap-of-Thought 能力,也称为创造力,目前的讨论和分析仍然较少...

数据安全又合规 京东云DeepSeek一体机助力金融机构快速用上大模型

数据安全又合规 京东云DeepSeek一体机助力金融机构快速用上大模型

随着金融科技的迅猛发展,越来越多的金融机构开始探索如何利用人工智能和大数据技术提升业务效率和服务质量。在这一背景下,京东云推出的DeepSeek一体机成为了众多金融机构的首选工具。它不仅能在保障数据安...

中信银行谷凌云:本月在部分业务中布局了DeepSeek模型

中信银行谷凌云:本月在部分业务中布局了DeepSeek模型

新京报贝壳财经讯(记者姜樊)3月27日,中信银行副行长谷凌云在2024年业绩发布会上表示,在DeepSeek R1发布后,中信银行立即组织了对应的分析和跟进,本月已在部分业务场景中部署了DeepSee...

李开复最新预测中国大模型终局,DeepSeek目前势头最强

李开复最新预测中国大模型终局,DeepSeek目前势头最强

近日,零一万物创始人兼CEO李开复在参与一档对话节目时公开表示,DeepSeek掀起的行业变革彻底颠覆了人工智能行业的发展模式,“可能让OpenAI创始人辗转难眠”。他同时预测,中国市场最终可能只剩下...

接入DeepSeek之后,企业什么样?

接入DeepSeek之后,企业什么样?

阅读提示随着DeepSeek等人工智能技术的不断成熟,传统企业和行业正站在转型升级的关键节点。这场由技术驱动的变革浪潮,在提升效率和优化成本的同时,也催生出新的商业模式和增长点,为经济发展注入新的动力...

清丰县人民检察院开展DeepSeeK培训会

清丰县人民检察院开展DeepSeeK培训会

大象新闻记者 刘洋 通讯员 侯彦磊为推动DeepSeek等新一代信息技术与检察业务深度使用,提升办公办案智能化水平,3月25日下午,清丰县检察院举办DeepSeek的使用技能专项培训,特邀杭州飞致云信...