当前位置:首页 > Deepseek最新资讯 > 正文内容

蚂蚁、OpenAI、DeepSeek卷疯了!国产最强万亿参数旗舰模型Ling-1

  据悉,Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

  基准测试数据显示,在有限输出Token条件下,Ling-1T于多项复杂推理基准中取得SOTA表现,同时在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T均取得领先成绩,多项指标位居开源模型的榜首。

  以竞赛数学榜单 AIME 25为例。Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro,后者平均达5000+Tokens,准确率为70.10%。蚂蚁Ling-1T用更少的Token实现了更高的准确率,性价比优于谷歌Gemini系列,展现出在推理精度和思考效率综合能力上的优势。

  不仅是蚂蚁,国庆中秋假期前后,OpenAI、阿里、智谱、DeepSeek等中国和美国的AI大模型加速竞争。

  英伟达CEO黄仁勋则指出,过去六个月AI计算需求大幅上升,英伟达新一代架构Blackwell的芯片需求“非常非常高”。他认为这标志着“新一轮工业革命”开始。

  英伟达上月宣布,计划未来十年向OpenAI共计投资1000亿美元,支持OpenAI部署需要10千兆瓦电力的英伟达系统,相当于400万至500万个GPU。

  OpenAI CEO奥尔特曼(Sam Altman)周三表示,技术突破的关键在于更聪明的模型、更长的上下文处理能力和更好的记忆系统。AGI的核心在于发现新知识,AGI 最重要的衡量标准已不是通过某个测试,而是 AI 开始具备“发现新知识”并扩展人类知识边界的能力。

  近年来,大语言模型发展迅速,尤其是DeepSeek热潮,引发学界和业界对通用人工智能(AGI)的广泛讨论,而混合专家(MoE)模型在特定任务中表现优异,但训练依赖高性能计算资源,成本高昂,限制了其在资源受限环境中的应用。

  蚂蚁Ling团队认为,虽然MoE模型训练对高性能AI芯片(如H100和H800)需求大,且资源供应,但低性能加速器更易获取且单位成本效益高,因此,模型需要能在异构计算单元和分布式集群间切换的技术框架。同时在AI Infra部分,在跨集群、跨设备的兼容和可靠层面进行性能优化。该公司设定的目标是“不使用高级GPU”来扩展模型。

  今年3月,蚂蚁集团Ling Team团队利用AI Infra技术开发两个百灵系列开源MoE模型Ling-Lite和Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,引发广泛关注。

  目前,蚂蚁AGI团队主要由蚂蚁集团副总裁、首席技术官何征宇负责。据悉,何征宇获佐治亚理工学院计算机博士学位;2012年至2018年就职于谷歌,在谷歌创立并领导了开源项目gVisor;2018年何征宇加入蚂蚁集团,负责公司技术基础设施建设,主导了蚂蚁云原生化、绿色计算实践、机密计算创新、开源战略布局等重要项目,而最新的百灵大模型计划聚焦在生活服务、金融服务、医疗健康等场景。

  Ling-1T沿用Ling 2.0架构,在20T+tokens高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

  值得一提的是,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

  强化学习阶段,蚂蚁百灵团队创新性地提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。另外,蚂蚁百灵团队提出了新的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。

  在ArtifactsBench 前端能力基准上,Ling-1T得分达59.31,并且在可视化和前端开发任务领域以显著优势位居开源模型榜首。

  据蚂蚁百灵团队透露,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。目前,开发者都可以体验Ling-1T模型deepseek

  据PitchBook统计,今年以来,全球AI领域初创公司已吸引创纪录的1927亿美元风险投资,2025年有望成为首个逾一半风投资金流入AI行业的年份。

  大部分风投资金流向相对成熟的初创公司。其中,OpenAI、Anthropic、xAI等头部AI创业公司本季均募集了上百亿美元,而一些知名度较低的新创公司则举步维艰,尤其是那些并非专注于AI的企业。PitchBook发现,IPO和并购环境紧缩也让部分风险投资人不愿押注未经验证的公司。

  最近一个季度,美国风险投资将62.7%的资金投向AI领域的公司,全球风险投资该比例为53.2%。今年以来,全球风投总额为3668亿美元,其中美国风投达到2502亿美元。

  PitchBook研究主管Kyle Sanford表示,“市场正在分化,要么在做人工智能,要么不是,要么是大公司,要么不是。”

  PitchBook AI和网络安全高级研究分析师 Dimitri Zabelin 表示,目前主要的退出趋势是频繁但价值较低的收购,以及价值明显较高的 IPO 数量较少。“这也与当前宏观环境中的流动性状况有关。”

  值得一提的是,早在2022年ChatGPT横空出世后,OpenAI在AI技术上突飞猛进,目前ChatGPT周活跃用户达8亿,8个月内增加了一倍。

  近期,OpenAI完成了一笔66亿美元融资,目前估值为5000亿美元,超越马斯克的SpaceX,成为全球最有价值的初创公司。

  另据The Information报道,今年前七个月,OpenAI收入大约翻了一番,预计年收入将达到120亿美元。同时,OpenAI已签下总额近1万亿美元的算力采购协议,有望成为全球赚钱能力最强的AI公司。(作者 林志佳)

  更多对全球市场、跨国公司和中国经济的深度分析与独家洞察,欢迎访问 Barrons巴伦中文网官方网站原文出处:蚂蚁、OpenAI、DeepSeek卷疯了!国产最强万亿参数旗舰模型Ling-1T开源,感谢原作者,侵权必删!

标签: deepseek

“蚂蚁、OpenAI、DeepSeek卷疯了!国产最强万亿参数旗舰模型Ling-1” 的相关文章

DeepSeek预测:美因茨vs多特蒙德!吉拉西火力全开,大黄蜂客场碾压?

DeepSeek预测:美因茨vs多特蒙德!吉拉西火力全开,大黄蜂客场碾压?

  德甲第5轮即将迎来一场焦点战,美因茨将在主场迎战多特蒙德。目前多特蒙德状态火热,而美因茨则略显挣扎。本场比赛能否成为一场进球盛宴?让我们深入分析。   多特蒙德目前以...

海信空调&央视新闻上新!发布两款2026世界杯全球官方空调!

海信空调&央视新闻上新!发布两款2026世界杯全球官方空调!

  9月29日,海信联合央视新闻举办“开新世界杯-海信超级新品”发布会,海信空调携两款2026世界杯全球官方指定空调亮相。隆重推出全球首款搭载星闪人感2.0技术的海信新风空调璀璨U6柜机,...

中加配置周报|DeepSeek发布V3.1模型,鲍威尔暗示政策转向

中加配置周报|DeepSeek发布V3.1模型,鲍威尔暗示政策转向

  1、中国新一期LPR出炉,1年期为3.0%,5年期以上为3.5%,连续三月保持不变。业内专家普遍认为,LPR继续“按兵不动”,符合预期。从LPR报价机制看,近期央行多次开展公开市场操作...

又卷起来了!DeepSeek和智谱将于近日发布新模型

又卷起来了!DeepSeek和智谱将于近日发布新模型

  9月29日消息,DeepSeek短暂上线V3.2,但很快无法再被搜索到。DeepSeek表示,其线上模型版本已完成更新deepseek。网易科技还了解到,智谱新模型GLM-4.6也将于...

所以说反对樊粉网暴其他队员,就是支持樊振东本人啊

所以说反对樊粉网暴其他队员,就是支持樊振东本人啊

  都current world ranking了,不需要世排吗,而且还有种子排名,不看世排看啥呢   都current world ranking了...

DeepSeek大事件引爆AI芯片行情!寒武纪20%涨停,半导体设备ETF涨超3

DeepSeek大事件引爆AI芯片行情!寒武纪20%涨停,半导体设备ETF涨超3

  今年以来截至8月11日,半导体设备ETF(561980)跟踪的中证半导指数累涨6.53%,领跑同类指数,寒武纪权重占比达8.19%,“寒王”权重在同类型指数中相对较高。...