当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞

13小时前Deepseek最新资讯15

  据新浪科技报道,近日DeepSeek再次新发布并开源的OCR模型,从根本上改变了AI游戏规则。Github开源项目DeepSeek-OCR,一夜收获超4k星。相关论文(《DeepSeek OCR:上下文光学压缩》)解释了这一研究成果。

  传统OCR如同“文字扫描仪”,通过光学技术将图像中的文字提取转换为计算机和人都能理解的格式。比如,在将大量票据、证件、表单等数据电子化时,OCR发挥关键作用。

  但DeepSeek却反其道而行之——将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解。如此创新尝试就是为了解决大模型的核心痛点——处理长文本时面临的计算挑战deepseek

  10页密密麻麻的文本报告,被压缩成一张图片,AI能够一眼读懂它。这样的信息处理效率意味着大幅降低了计算复杂度,用最直接的方式节约成本。

  最近还在锐评AI发展的OpenAI创始团队成员、特斯拉前AI总监Karpathy,对DeepSeek新成果直言喜爱,并指出“早就该让视觉成为AI核心,而非依赖烂透了的文本分词器。”

  更有业内大佬感叹,“当文本能被转化为视觉可理解的结构,语言与视觉的统一或许不再是理论。这可能是通往 AGI(通用人工智能)的关键一步。

  深度学习模型的记忆以分布式参数形式存储,这种非结构化存储导致传统神经网络在学习新任务时,旧知识的参数空间会被新知识覆盖,模型无法做到像人类一样进行连贯推理。

  而DeepSeek的想法是,通过视觉-文本压缩范式和动态分层遗忘机制,让AI“记住该记住的,忘记该忘记的”。

  其核心思路是将文本信息转化为视觉token,通过光学压缩实现高效记忆管理,同时模拟人类遗忘曲线动态调整信息留存。原文出处:DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞” 的相关文章

有一说一,科比的历史排名高于奥尼尔库里詹姆斯。

有一说一,科比的历史排名高于奥尼尔库里詹姆斯。

  姚明进入nba开始,火箭的球基本没有落下,又是马刺的球迷,科比的强大真的是领略到的,别说什么四氧化三铁,越关键他越会出手。   姚明进入nba开始...

《时代》公布年度300大发明榜单:宇树科技、DeepSeek、华为、比亚迪上榜

《时代》公布年度300大发明榜单:宇树科技、DeepSeek、华为、比亚迪上榜

  北京时间10月10日,美国《时代》杂志公布了2025年度最佳发明榜单,共有300款产品上榜,其中包括宇树科技、DeepSeek、华为、   自2000年以来,《时代》...

DeepSeek预测:阿森纳vs西汉姆联!枪手主场血洗铁锤帮?哲凯赖什+萨卡双星

DeepSeek预测:阿森纳vs西汉姆联!枪手主场血洗铁锤帮?哲凯赖什+萨卡双星

  北京时间10月4日晚22点,英超第7轮将上演伦敦德比,目前排名第2的阿森纳坐镇酋长球场迎战倒数第2的西汉姆联。枪手近期状态火热,近10场7胜2平1负(进19球失6球),而铁锤帮近10场...

腾讯教育助力东南大学计算机科学与工程学院拔尖创新人才培养,共探AI助力交叉学科建

腾讯教育助力东南大学计算机科学与工程学院拔尖创新人才培养,共探AI助力交叉学科建

  近日,腾讯云与东南大学计算机科学与工程学院(简称“计算机学院”)开展深度合作,双方基于腾讯前沿AI技术与数字化基础设施,共同探索人才培养、课程创新、学科融合发展等新模式。...

沐曦股份即将上市 其下一代国产高端GPU芯片或再现“DeepSeek神话”

沐曦股份即将上市 其下一代国产高端GPU芯片或再现“DeepSeek神话”

  近日,上海证券交易所公告显示,上市审核委员会定于10月24日审议沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)的首发申请。   作为国内高性能GPU产品的领...

Deepseek推荐全国旅游百强区第7名:广西南宁市青秀区

Deepseek推荐全国旅游百强区第7名:广西南宁市青秀区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...