当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

4周前 (04-02)Deepseek最新资讯162

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

文心一言:请详细介绍Deepseek在智能客服系统中的应用

文心一言:请详细介绍Deepseek在智能客服系统中的应用

文心一言:请详细介绍Deepseek在智能客服系统中的应用DeepSeek在智能客服系统中的应用为企业带来了显著的提升和变革。以下是对DeepSeek在智能客服系统中应用的详细介绍:一、提升复杂文本问...

带DeepSeek畅游巴塞罗那:是旅游搭子,更是高级“嘴替”

带DeepSeek畅游巴塞罗那:是旅游搭子,更是高级“嘴替”

当一个人完全没有做攻略就来到一个语言、文字不通的城市,该如何更好的生活or游玩呢?以前,我去外面旅游基本上会用到3-5个不同的app(不包括临时下载的本地功能性app),涵盖翻译、旅游攻略、旅游避坑等...

阿里否认“10亿美元投资DeepSeek”

阿里否认“10亿美元投资DeepSeek”

2月7日,阿里方面否认了投资DeepSeek的传闻。2月7日,阿里巴巴集团副总裁颜乔在朋友圈表示:“同为中国杭州企业,我们为DeepSeek鼓掌,但是外界流传阿里投资DeepSeek的信息是假消息。”...

太平资产完成DeepSeek本地化部署

太平资产完成DeepSeek本地化部署

上证报中国证券网讯(记者 何奎)记者近日获悉,太平资产积极响应国家科技创新战略,顺应人工智能时代潮流,成功完成DeepSeek-R1大模型本地化部署,并实现国产化适配。据介绍,通过本地化部署DeepS...

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出

暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出

【新智元导读】只有660B参数的开源模型,在数学和编程性能上击败了GPT-4.5和Claude 3.7。DeepSeek-V3-0324新版本的发布让全球网友为之疯狂,推理能力提升近20%,模型权重已...

DeepSeek如何助力医疗服务智能化?

DeepSeek如何助力医疗服务智能化?

DeepSeek通过其先进的人工智能技术,为医疗服务智能化提供了有力支持。以下是DeepSeek助力医疗服务智能化的具体方式:一、提升医疗效率快速文献检索:DeepSeek能够快速检索最新的医学文献和...