当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

4个月前 (02-24)Deepseek最新资讯195

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

怎么查看 Deepseek的搜索历史记录?

怎么查看 Deepseek的搜索历史记录?

怎么查看 Deepseek 的搜索历史记录?要查看deepseek的搜索历史记录,您可以按照以下步骤操作:手机版本打开deepseek应用。点击左上角的时钟图标,进入历史记录页面。在这里,您可以查看所...

DeepSeek在各行各业“上岗”,对你的“饭碗”有影响吗?

DeepSeek在各行各业“上岗”,对你的“饭碗”有影响吗?

这里谈谈我所在的行业: 2025年伊始,deepseek这只黑天鹅横空出世,带来一场深度产业革命,引发全民关注。各行各业争先接入,以推动产业升级,房产中介与贷款中介也面临着新的局面。 与房...

梅州市12345热线正式接入DeepSeek

梅州市12345热线正式接入DeepSeek

2月21日,梅州市正式将DeepSeek大模型应用于12345政务服务便民热线,以AI技术赋能民生诉求响应,此举标志着梅州政务服务向智慧化、数字化转型迈出关键一步。梅州市政务服务和数据管理局相关负责人...

商络电子:公司正计划引入DeepSeek大模型

商络电子:公司正计划引入DeepSeek大模型

商络电子在互动平台表示,公司正计划引入Deepseek大模型,搭建私有化的AI平台,应用于数据的分析和预测,为公司提供辅助决策能力;另外将AI能力无缝对接通用业务场景,用于提升公司整体效率和能力。(本...

外界热议:DeepSeek又变强了!

外界热议:DeepSeek又变强了!

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,...

DeepSeek成出境游神器!在西班牙我发现它还能这样用

DeepSeek成出境游神器!在西班牙我发现它还能这样用

当一个人完全没有做攻略就来到一个语言、文字不通的城市,该如何更好的生活or游玩呢?以前,我去外面旅游基本上会用到3-5个不同的app(不包括临时下载的本地功能性app),涵盖翻译、旅游攻略、旅游避坑等...