当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

7个月前 (02-15)Deepseek最新资讯397

智东西2月14日报道，刚刚，DeepSeek在开源社区Hugging Face上的点赞数跃居第一，获约8730次点赞，这一数字仍在持续上涨。

这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后，DeepSeek创下的又一个历史时刻，在海外平台再次登顶。

Hugging Face点赞榜单前十名的模型中，都曾在不同节点引爆整个大模型产业。

排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1，由StableDiffusion原班人马成立的黑森林工作室打造，点赞数约8710次。

排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM，第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B，其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。

OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列，排名第11，点赞数约3810次。

此外，DeepSeek-V3的排名在第19名，点赞约3810次，超越了微软的Phi-2和谷歌Gemma-7B模型。

Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B，该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

▲开源社区Hugging Face点赞榜（图源：Hugging Face）

DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。

DeepSeek V3为DeepSeek自研MoE模型，参数量达到671B，激活参数量37B，在14.8T token上进行了预训练，该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型，并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。

DeepSeek R1在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版，在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时，蒸馏了6个小模型，其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

多模态模型Janus-Pro是去年发布的Janus的高级版本，可显著提高多模态理解和视觉生成。

当下，全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮，DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。

标签: DeepSeek 人工智能深度求索应用场景数据分析大数据

返回列表

上一篇：被AI妆到了！DeepSeek教网友化妆，竟像极了“石矶娘娘”

下一篇：别踩坑！DeepSeek官方发布声明

“DeepSeek又得了个第一” 的相关文章

DeepSeek又得了个第一

“DeepSeek又得了个第一” 的相关文章

DeepSeek在医疗诊断中的具体应用有哪些？

“算”启“新”局从三个维度探与DeepSeek合作前路——访立昂技术总裁周路

deepseek能直接生成ppt吗？

AI应用激活算力需求昇腾大EP推理方案助力DeepSeek部署

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.

DeepSeek又得了个第一

“DeepSeek又得了个第一” 的相关文章

DeepSeek在医疗诊断中的具体应用有哪些？

“算”启“新”局 从三个维度探与DeepSeek合作前路——访立昂技术总裁周路

deepseek能直接生成ppt吗？

AI应用激活算力需求 昇腾大EP推理方案助力DeepSeek部署

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

Powered By Z-BlogPHP. Theme by TOYEAN.

“算”启“新”局从三个维度探与DeepSeek合作前路——访立昂技术总裁周路

AI应用激活算力需求昇腾大EP推理方案助力DeepSeek部署