DeepSeek新模型实现十倍文本压缩精度97%,A100日处理20万页数据
据机器之心,在DeepSeek-OCR的处理过程中,1000个字的文章能被压缩成100个视觉token,十倍的压缩下精度也可以达到97%,一块英伟达A100每天就可以处理20万页的数据。这种方式或许可以解决大模型领域目前头疼的长上下文效率问题,更重要的是,如果“看”文本而不是“读”文本最终被确定为正确的方向,也意味着大模型的范式会发生重要的转变。
短期来看deepseek,DeepSeek-OCR能同时做到节省算力和提高训练效率,相当实用。而对业界长期发展来说,新模型再次给业内提了个醒——力大砖飞是一条路,但“小而美”同样潜力无限、魅力无限。原文出处:DeepSeek新模型实现十倍文本压缩精度97%,A100日处理20万页数据,感谢原作者,侵权必删!