[发明专利]提取动态生成网页内容的技术方案无效
申请号: | 200810094188.5 | 申请日: | 2008-05-08 |
公开(公告)号: | CN101576885A | 公开(公告)日: | 2009-11-11 |
发明(设计)人: | 韩露 | 申请(专利权)人: | 韩露 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100023北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种技术方案涉及计算机网络应用和软件、硬件及其结合领域,可以在请求获得网页数据的客户端(如浏览器等)或网络转发节点(如代理服务器等)精确灵活地提取动态网页数据中的特定内容。对于给定的网页数据,根据一组区域定位要素信息从一个较大的数据查找区域(以下称为查找区域)中定位出一个较小的子区域(以下称为结果区域)。这个结果区域是由针对查找区域的两个定位指针来确定,即由两个定位指针指出查找区域内部的两个位置,这两个位置之间的区域即为结果区域。根据需要可以多次使用此方法,后续的每一次查找都使用前一次的结果区域作为当次的查找区域,并使用该轮次的特定区域定位要素信息来确定定位指针位置。这样,就可以逐步缩小查找区域和结果区域的范围,直到结果区域即为预先期望的目标数据,则数据的定位和提取完成。其中,定位指针的定位是通过对标志正则表达式按照特定规则搜索的方式来达成。 | ||
搜索关键词: | 提取 动态 生成 网页 内容 技术 方案 | ||
【主权项】:
1.本发明提供一种对动态生成网页中特定动态内容进行精确提取的技术,其特征是:对于网页数据内给定的一个查找区域,将两个定位指针通过查找操作定位在区域内,截取两个定位指针之间的子区域作为结果区域。结果区域可以作为内容查找和提取的目标数据。或者,也可以多次应用此过程,将前一轮查找得到的结果区域,作为后一轮查找的查找区域,直到指定的查找轮次,其结果区域为内容查找和提取的目标数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩露,未经韩露许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810094188.5/,转载请声明来源钻瓜专利网。
- 上一篇:燃气热水器多机通信系统
- 下一篇:一种液晶显示装置