[发明专利]一种物联网动态页面实时信息采集方法有效

专利信息
申请号: 201310005966.X 申请日: 2013-01-08
公开(公告)号: CN103092936B 公开(公告)日: 2018-01-02
发明(设计)人: 孔英会;沈丹凤 申请(专利权)人: 华北电力大学(保定)
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 石家庄冀科专利商标事务所有限公司13108 代理人: 李羡民,高锡明
地址: 071003 河*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种物联网动态页面实时信息采集方法,所述方法分为四个部分,涉及四个模块,这四个模块分别是加载页面模块、获取页面HTML模块、解析所得HTML模块和数据存储模块,加载页面模块通过网络链接地址加载外部页面,并将加载的动态页面传递给获取HTML模块,由获取HTML模块获取该页面的HTML文档,同时将所获得的HTML文档传递给解析HTML模块,解析HTML模块通过定位技术从得到的HTML文档中解析出所需要的文本内容,并将这些文本内容传给数据存储模块进行存储。本发明实现了物联网实体动态信息的实时获取及存储,而且不需要连接服务器上的数据库,具有良好的可扩展性,能满足物联网海量数据量的处理要求。
搜索关键词: 一种 联网 动态 页面 实时 信息 采集 方法
【主权项】:
一种物联网动态页面实时信息采集方法,其特征是,所述方法分为四个部分,涉及四个模块,这四个模块分别是加载页面模块、获取页面HTML模块、解析所得HTML模块和数据存储模块;其中,加载页面模块通过网络链接地址加载外部页面,并将加载的动态页面传递给获取HTML模块,由获取HTML模块获取该页面的HTML文档,同时将所获得的HTML文档传递给解析HTML模块,解析HTML模块通过定位技术从得到的HTML文档中解析出所需要的文本内容,并将这些文本内容传给数据存储模块进行存储;所述采集按以下步骤进行:1)首先通过“Watir::Browser.new”创建一个浏览器实例,从而来模拟浏览器的操作,通过“goto('http://10.14.11.100/sh/index.jsp')”方法加载到物联网智能家居动态页面;2)在Watir模拟浏览器的过程中,通过“onclick”方法模拟点击操作,对步骤1)中加载的页面实现翻页功能,通过“li(:id,'mainlevel_02').links[0].click”方法实现模拟点击翻页操作;3)通过IFrame框架的src属性使Watir定位到“jsp/wsd.jsp”,即用方法“.frame(:src,'jsp/wsd.jsp')”实现定位,其中“jsp/wsd.jsp”即为步骤2)中翻页后动态显示实时跳变数据的JS模块;通过循环加载物联网动态页面的对应框架,周期获取框架下的HTML文档,代码循环实现速度快;4)利用Watir的等待机制以及Ruby的休眠机制来控制等待加载动态页面的时间,即通过“.wait”方法和“sleep()”方法实现等待;5)Watir通过“.frame.html”方法获取步骤3)中框架下的HTML文档;6)Nokogiri通过“Nokogiri::HTML.parse”方法爬取步骤5)获得的HTML文档,并进行解析;7)Nokogiri通过“.css('div.shiduqu div.shidu').text”方法对步骤6)中爬取的HTML文档实现CSS Selector定位功能,返回文本内容;8)利用Ruby中的File类创建文档,用来存储步骤7)中返回的文本数据,通过“File.new(#{i}.txt,w)”方法实现创建txt文档,并将内容写入文档中,其中“#{i}”即为文档名,通过变量i来控制,实现循环存储的功能,即每循环一次就创建一个新的文档;使用开发式的统一数据库接口DBI与数据库驱动插件连接,实现对数据库的访问和操作数据;9)判断是否执行循环条件,从而实现循环存储的功能,即每循环一次就创建一个新的文档。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定),未经华北电力大学(保定)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310005966.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top