全国首个!这个万亿参数大模型发布 国产算力完成训练。6月30日,美团正式发布了新一代基础大模型LongCat-2.0。这是国内首个依靠国产算力完成训练和推理全流程的万亿参数大模型。
LongCat-2.0采用MoE架构,总参数规模达到1.6万亿,每个Token激活参数约480亿,原生支持1M超长上下文,可一次处理百万字级输入。该模型全程在国产算力上完成训练,峰值规模超过5万张国产算力卡,是迄今为止国产算力上完成的最大训练任务。
由于算力优化和技术突破等因素,LongCat-2.0的训练和推理成本低于全球其他万亿参数级别的大模型。LongCat官方宣布,将在近期于多平台同步开源Infra框架、推理引擎及模型参数等核心技术,回馈全球开发者社区。全国首个!这个万亿参数大模型发布 国产算力完成训练
发表回复
要发表评论,您必须先登录。