当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

7个月前 (02-15)Deepseek最新资讯397

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?思考和行动过程用户希望了解DeepSeek在医疗诊断中的具体应用。DeepSeek是一款开源的人工智能模型,具备强大的自然语言处理和数据分析能力,可能在医...

“算”启“新”局 从三个维度探与DeepSeek合作前路——访立昂技术总裁周路

“算”启“新”局 从三个维度探与DeepSeek合作前路——访立昂技术总裁周路

新华财经乌鲁木齐3月14日电(记者郝玉、郭燕、王菲)当前,DeepSeek崛起引领全球AI产业浪潮,给各行业带来机遇和挑战。但其背后,是算力、云计算作为重要支撑。近期,记者对话立昂技术股份有限公司总裁...

deepseek能直接生成ppt吗?

deepseek能直接生成ppt吗?

deepseek能直接生成ppt吗?目前DeepSeek作为文本生成模型,无法直接生成PPT文件,但可以通过以下方式辅助制作专业演示文稿:一、文案生成技巧标题优化复制代码“生成10个科技风PPT标题,...

AI应用激活算力需求 昇腾大EP推理方案助力DeepSeek部署

AI应用激活算力需求 昇腾大EP推理方案助力DeepSeek部署

随着各行各业加速接入国产开源大模型DeepSeek,如何应对人工智能大范围落地应用带来的庞大算力需求,成为当下国内算力产业必须面对的机遇与挑战。在这样的大背景下,昇腾大EP(专家并行)推理方案凭借其独...

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

媒体报道,全国人大代表、四川天府银行董事长黄毅接受采访时表示,人工智能大模型为银行业转型带来诸多机遇。其一,显著降低大模型应用成本。其开源策略使企业能够以较低成本使用先进大模型,减轻银行尤其是中小银行...

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

IT之家 3 月 30 日消息,DeepSeek 未来有可能替代科幻作家吗?据央视财经昨日报道,科幻作家刘慈欣表示,暂时不太会,但是再过 10 年、20 年,从理论上说完全可能代替科幻小说作家。刘慈欣...