当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

8个月前 (02-24)Deepseek最新资讯449

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

江门多家企事业单位“牵手”DeepSeek

江门多家企事业单位“牵手”DeepSeek

今年以来从政务服务到创意创作从企业研发生产到产品升级千行百业纷纷接入DeepSeek它宛如一把钥匙开启各行各业智能化变革的大门市委十四届八次全会暨全市高质量发展大会强调,要实施“人工智能+”行动计划,...

联想与沐曦DeepSeek一体机上市首月发货量突破千台

联想与沐曦DeepSeek一体机上市首月发货量突破千台

【联想与沐曦DeepSeek一体机上市首月发货量突破千台】《科创板日报》7日讯,《科创板日报》记者获悉,联想集团与沐曦股份合作的首个国产DeepSeek一体机解决方案发布一个月以来,截至今日,其累计发...

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

山东移动济南分公司与山东第一医科大学合作DeepSeek项目

近日,中国移动通信集团山东有限公司济南分公司与山东第一医科大学达成合作,成功落地DeepSeek项目,为学校部署DeepSeek-R1“满血”版大模型,标志着山东移动济南分公司在“AI+教育”领域迈出...

英伟达新GPU再王炸,也得靠蹭DeepSeek卖卡

英伟达新GPU再王炸,也得靠蹭DeepSeek卖卡

一身皮衣黄仁勋,GTC 2025上意气风发。虽然最近英伟达的股票跌得比较狠,甚至来到了10年来的最低点,但这不影响老黄,对最新的GPU们信心满满。时间回拨到2月初,DeepSeek的发布在AI领域掀起...

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

       应用中的DeepSeek医疗智能操作系统。  近日,保山市人民医院紧跟国内人工智能趋势,正式完成DeepSeek医疗智能系统的本地化部署,这一举措...

广东多地政府部门接入DeepSeek

广东多地政府部门接入DeepSeek

【广东多地政府部门接入DeepSeek】财联社2月15日电,广东多地政府部门开始在政务系统部署接入DeepSeek。据了解,2月8日,深圳市龙岗区政务服务和数据管理局已经在政务外网部署上线了DeepS...