当前位置:首页 > Deepseek应用场景 > 正文内容

升级版DeepSeek-V3模型开源!DeepSeek上可试用体验

4个月前 (03-26)Deepseek应用场景310

【TechWeb】3月25日消息,DeepSeek在开源平台上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,其早期版本参数为6710亿,相比有小幅增长。

开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

同时DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议允许模型蒸馏、商用等行为,给了开发者更多的自主权。

DeepSeek在其官方交流群中称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。

从网友初步反馈的实测效果来看,V3编码能力已经接近 Claude3.7,在网站开发能力、UI设计方面展现出巨大的进步,数学能力也有提升,能像推理模型一样解题。

DeepSeek于2024年12月26日发布了DeepSeek-V3 首个版本,当时,该版本的DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。(宜月)


“升级版DeepSeek-V3模型开源!DeepSeek上可试用体验” 的相关文章

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是D...

电信运营商接入DeepSeek影响几何?

电信运营商接入DeepSeek影响几何?

中新网北京2月28日电 (记者 刘育英)中国三家电信运营商已全面接入DeepSeek,给运营商充分利用自身算力,加快赋能千行百业数智化转型,改善自身业绩带来机遇。至2月初,中国电信旗下天翼云“息壤”已...

联想与沐曦DeepSeek一体机上市首月发货量突破千台

联想与沐曦DeepSeek一体机上市首月发货量突破千台

联想集团与沐曦股份合作的首个国产DeepSeek一体机解决方案发布一个月以来,截至今日(3月7日),其累计发货量已突破千台。(界面新闻)...

AI视频大模型赛道:谁能成为下一个DeepSeek?

AI视频大模型赛道:谁能成为下一个DeepSeek?

DeepSeek压力传导至“六小虎”,部分企业调整战略,如零一万物全面拥抱DeepSeek,月之暗面参与价格战。国内AI视频生成领域中,爱诗科技、生数科技、智象未来等公司崭露头角。在“百模大战”背景下...

扬州海关政务终端接入DeepSeek

扬州海关政务终端接入DeepSeek

原标题:扬州海关政务终端接入DeepSeek科技日报讯 (尹红燕 单晓明 记者陈瑜)近日,扬州海关依托DeepSeek研发的大模型技术在政务服务领域取得突破,首批3台“扬关小智”智能政务终端正式投入运...

AI如何认识生物育种?我们考了考Deepseek

AI如何认识生物育种?我们考了考Deepseek

近期,DeepSeek-R1受到了全世界的关注。在农业领域,人工智能对生物育种产生了深刻影响,AI如何认识生物育种?光明网记者问了Deepseek 5个问题,并邀请中国农业科学院生物技术研究所科研处处...