当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

2个月前 (02-24)Deepseek最新资讯132

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

科技云报到:多行业拥抱DeepSeek,全不顾它身上的“刺”

科技云报到:多行业拥抱DeepSeek,全不顾它身上的“刺”

科技云报到原创。在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,...

官宣!海信成全球首个接入DeepSeek的电视品牌

官宣!海信成全球首个接入DeepSeek的电视品牌

2月11日,海信电视宣布正式接入DeepSeek,并支持满血R1和V3版本自由切换,成为行业首个搭载深度思考智能体的电视品牌。目前,海信电视正在进行用户终端的升级发布,预计3-5天内,所有搭载智能体的...

李彦宏:DeepSeek不是万能,最大问题是慢和贵,大多数大模型速度比DeepSeek满血版更快,价格更低「附多模态大模型行业市场分析」

李彦宏:DeepSeek不是万能,最大问题是慢和贵,大多数大模型速度比DeepSeek满血版更快,价格更低「附多模态大模型行业市场分析」

(图片来源:摄图网)4月25日,百度创始人李彦宏在reate2025百度AI开发者大会上发表了题为《模型的世界 应用的天下》的演讲。他在演讲中称 “DeepSeek不是万能的”,并指出了DeepSee...

京东云全面适配最新版DeepSeek模型,推理速度提升50%

京东云全面适配最新版DeepSeek模型,推理速度提升50%

央广网北京3月26日消息 近日,DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因,更凭借 MLA(多头潜在注意力)和...

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

每经AI快讯,有投资者在投资者互动平台提问:请问贵司有没有Deepseek概念?汉王科技(002362.SZ)4月10日在投资者互动平台表示,目前公司的电纸本全系产品已经接入Deepseek-R1和V...

从Deepseek谈东方数理哲学与AI新文明

从Deepseek谈东方数理哲学与AI新文明

2月28日下午,由北京市社会组织党建联合会与中关村超互联新基建产业创新联盟联合主办的 “从Deepseek谈东方数理哲学与AI新文明范式” 交流会在北京成功举办。此次活动汇聚了人工智能、传统文化、社会...