[发明专利]一种网页信息获取方法、装置以及设备在审
申请号: | 201811070912.0 | 申请日: | 2018-09-13 |
公开(公告)号: | CN109165332A | 公开(公告)日: | 2019-01-08 |
发明(设计)人: | 张忠伟 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F16/95 | 分类号: | G06F16/95;G06F8/71 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模板参数 模板配置文件 网页信息获取 开发人员工作量 开发效率 网页信息 自动获取 申请 匹配 页面 存储 网页 更新 开发 | ||
本申请提供了一种网页信息获取方法,在该方法中提出了基于模板配置文件来存储各个web应用各自对应的模板参数,通过该模板参数来指定所需获取的页面中的指定位置的指定数据,进而在需要获取网页信息时,先判断web应用的类型,在模板配置文件中匹配对应的模板参数,基于该模板参数从该web应用的网页中自动获取对应的信息。基于此,若有新的web应用,开发人员只需要更新模板配置文件中的模板参数,这样利用该方法就能够快速适应新的web应用环境,减少开发人员工作量,提高开发效率,另外,本申请还提供了对应的装置和设备。
技术领域
本申请涉及计算机技术领域,尤其涉及一种网页信息获取方法、装置以及设备。
背景技术
随着计算机技术的发展,在许多应用中都需要获取网页中的指定信息,而传统的网页信息获取方法主要是利用预先开发的脚本,运行脚本从网页中自动获取指定信息。
由于不同网络(web)应用的页面开发技术不同,一个脚本往往无法适配多种web应用的页面信息获取,因此,通常在需要获取不同web应用的页面信息时,开发人员需要先针对不同web应用编写不同的脚本,这就导致当web应用较多时,开发人员需要编码更多的脚本来实现网页信息获取功能,对于开发人员而言,脚本编写的工作量较大,且效率较低,这就导致传统的网页信息获取方法,无法适应于web应用日新月异的网络环境。
基于此,目前亟需开发一种网页信息获取方法能够快速适应web应用日新月异的网络环境,以简化开发人员的工作量,提高开发效率。
发明内容
本申请实施例提供了一种网页信息获取方法,该方法基于模板配置文件实现从网页中自动获取相关信息,由于模板配置文件能够随着需求而不断更新,因此,该方法能够适应于web应用日异月新的环境,能够兼容多种web应用的网页获取场景。
具体的,在本申请第一方面提供了一种网页信息获取方法,该方法包括:
识别网络应用的应用类型;
从模板配置文件中读取与所述应用类型匹配的模板参数,所述模板参数包括指定节点名称和指定标签属性,所述模板配置文件中存储有多种网络应用各自对应的模板参数;
根据所述指定节点名称定位所述网络应用的网页中节点,并从所述节点相关信息中获取所述指定标签属性对应的信息。
可选的,以后台进程的方式,循环执行根据所述指定节点名称定位所述网络应用的网页中节点,并从所述节点相关信息中获取所述指定标签属性对应的信息的步骤。
可选的,所述方法还包括:
更新所述模板配置文件。
可选的,所述方法还包括:
将所述信息存储至本地数据库中。
可选的,所述方法还包括:
将所述信息存储于指定服务器中,并在本地数据库中存储所述信息的存储地址。
可选的,所述指定标签属性包括:
指定标签的类名和/或者指定标签的唯一标识。
可选的,所述指定标签属性对应的信息包括一下任意或者多种类型:
网址、文本、图片和/或视频。
在本申请第二方面提供了一种网页信息获取装置,该装置包括:
识别模块,用于识别网络应用的应用类型;
匹配模块,用于从模板配置文件中读取与所述应用类型匹配的模板参数,所述模板参数包括指定节点名称和指定标签属性,所述模板配置文件中存储有多种网络应用各自对应的模板参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811070912.0/2.html,转载请声明来源钻瓜专利网。