[发明专利]一种资源下载方法、装置、终端设备及存储介质在审
| 申请号: | 202011609706.X | 申请日: | 2020-12-30 | 
| 公开(公告)号: | CN112667898A | 公开(公告)日: | 2021-04-16 | 
| 发明(设计)人: | 刘均;杨诗雨 | 申请(专利权)人: | 深圳市轱辘车联数据技术有限公司 | 
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955;G06F9/451;G06K9/32;H04L29/08 | 
| 代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 梁立耀 | 
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 资源 下载 方法 装置 终端设备 存储 介质 | ||
本申请适用于计算机技术领域,提供一种资源下载方法、装置、终端设备及存储介质。其中,方法包括:在第一数据表中查询到正在下载或未下载的目标资源时,查找第二数据表中目标资源是否为已下载状态;在第二数据表中所述目标资源不为已下载状态时,根据对应下载地址下载所述目标资源;在目标资源下载成功时,将第一数据表与所述第二数据表中目标资源的下载状态更新为下载完成状态。本申请实施例通过第一数据表和第二数据表记录下载状态,并更新第一数据表和第二数据表的下载状态,可保证在下载中断后重新下载或者下载资源过多时,根据两个数据表中的下载状态自动进行下载,可无缝衔接,不会出现遗漏或者重复下载的情况,从而提高了下载效率。
技术领域
本申请属于计算机技术领域,尤其涉及一种资源下载方法、装置、终端设备及存储介质。
背景技术
随着计算机技术的发展,可进行自动化下载网络资源,目前自动化下载网络资源通常是通过网络爬虫的技术实现,网络爬虫是一种自动抓取网页并提取网页内容的程序,在提取网页内容时通常是对抓取的网页进行解析得到网页结构,再解析出网页上的下载按钮来实现下载数据,从而获取资源。
然而,当页面下载中断或下载资源较多时,容易出现遗漏或重复下载的情况,使得下载效率低。
发明内容
本申请实施例提供了一种资源下载方法、装置、终端设备及存储介质,旨在解决现有资源自动下载时,在下载中断或下载资源较多时,容易出现遗漏或重复下载的情况,使得下载效率低的问题。
第一方面,本申请实施例提供了一种资源下载方法,包括:
查询第一数据表中的所有资源的下载状态;所述第一数据表包括至少一条资源的下载状态;
在所述第一数据表中查询到正在下载或未下载的目标资源时,查找第二数据表中所述目标资源是否为已下载状态;所述第二数据表包括所述目标资源的下载状态及对应下载地址;
在所述第二数据表中所述目标资源不为已下载状态时,根据对应下载地址下载所述目标资源;
在所述目标资源下载成功时,将所述第一数据表与所述第二数据表中所述目标资源的下载状态更新为下载完成状态。
在一个实施例中,所述在所述第一数据表中查询到正在下载或未下载的目标资源时,查找第二数据表中所述目标资源是否为已下载状态,包括:
在所述第一数据表中查询到未下载的目标资源时,将所述第一数据表中目标数据的下载状态更新为正在下载状态,并查找第二数据表中所述目标资源是否为已下载状态。
在一个实施例中,在所述第二数据表中所述目标资源不为已下载状态时,根据对应下载地址下载所述目标资源之后,包括:
在所述目标资源未下载成功的时间段内,将所述第二数据表中所述目标数据的下载状态更新为正在下载状态。
在一个实施例中,所述下载地址包括统一资源定位符;
所述在所述第二数据表中所述目标资源不为已下载状态时,根据对应下载地址下载所述目标资源,包括:
根据所述目标资源对应的统一资源定位符,进入所述目标数据所在的网页;
对所述网页进行图像识别;
在识别出预设图标时,确定鼠标点击的位置信息;其中,所述预设图标为预存储鼠标点击位置对应图标的截图图像;
根据所述鼠标点击的位置信息,点击对应位置,以进行所述目标资源下载。
在一个实施例中,所述根据所述目标数据的统一资源定位符,进入所述目标数据所在的网页,包括:
根据所述目标资源对应的统一资源定位符,通过selenium工具控制预设浏览器进入所述目标数据所在的网页。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市轱辘车联数据技术有限公司,未经深圳市轱辘车联数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011609706.X/2.html,转载请声明来源钻瓜专利网。





