DeepSeek发布梁文锋署名新论文 开源记忆模块Engram

  DeepSeek于12日晚发布了一篇新论文《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》。这篇论文由北京大学与DeepSeek合作完成,梁文锋是合著者之一。论文介绍了一种名为条件记忆的技术,通过引入一种可扩展的查找记忆结构,在保持相同参数和计算资源的情况下,能够显著提高模型在知识调用、推理、代码编写和数学问题解决等任务上的表现。此外,DeepSeek还开源了相关记忆模块Engram。DeepSeek发布梁文锋署名新论文 开源记忆模块Engram