[发明专利]基于移动浏览器的网页处理方法及系统有效
申请号: | 201310744595.7 | 申请日: | 2013-12-30 |
公开(公告)号: | CN103761257B | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 梁捷;董洲 | 申请(专利权)人: | 优视科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿元知识产权代理有限公司11327 | 代理人: | 陈英俊,龚洁 |
地址: | 100080 北京市海淀区苏州街2*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 移动 浏览器 网页 处理 方法 系统 | ||
技术领域
本发明涉及移动浏览器技术领域,更为具体地,涉及一种基于移动浏览器的网页处理方法及系统。
背景技术
随着网络的高速发展,人们通过访问网站,可以随时随地获取自己想要的资讯或者服务。在目前的网站建设过程中,大多数的中小型网站都采用模板系统搭建而成,例如视频网站、小说网站等。
但是,采用模板系统搭建而成的网站会不可避免地存在以下问题:由于广告是网站的主要营收手段,因此,采用模板系统所搭建的网站广告多,使网站页面不清爽,这是其一;其二,由于网站采用模板系统搭建而成,即使是不同的网站也有可能采用同一模板系统,因此,采用同一模板系统生成的网站,其用户界面结构基本一致,相似度如此高的网站不利于用户的体验;其三,为了搜索引擎优化,方便爬虫的抓取和收录,采用模板系统搭建的网站均采用伪静态化的页面,造成网站承受力低、伪静态页面和动态页面重复等,并且网站数据的更新也非实时更新,而是使用定时更新或者手动后台更新,造成数据更新不及时等问题。
针对上述采用模板系统搭建而成的网站所存在的问题,现有的处理方法是基于域名进行判断,即直接把网站的网址加到域名白名单中。其中,一个域名白名单对应一个网页。用户在访问网站时,服务器只要判断出用户所请求访问的网址存在于白名单中,即可将进行单独转码后的新页面提供给用户。
然而,由于采用模板系统所搭建的网站会经常发生域名变换,因此,在基于域名白名单方式进行转码时,一旦网站的域名发生变化,那么该网站的网址就不会在白名单中出现,服务器也就不会对该网站进行转码转换并生成新的页面提供给用户。如果要保证服务器能将网站进行转码并生成新的页面提供给用户,则需要人工及时更新域名白名单,这不仅工作效率低、人工维护成本高,并且用户的体验也不好。
发明内容
鉴于上述问题,本发明的目的是提供一种基于移动浏览器的网页处理方法及系统,以解决服务器在使用模板系统所搭建的网站进行转码并生成新页面提供给用户时,受域名白名单影响的问题,降低网站的维护成本,提高工作效率和用户体验。
根据本发明的一个方面,提供一种基于移动浏览器的网页处理方法,包括:
根据用户发送的网站访问请求中所含有的该网站的更新时间参数,确定网站的结构类型;其中,
当确定网站的结构类型为伪静态网站时,通过判断伪静态网站中的伪静态网页的head标签下的title标签和meta标签是否含有预设的关键字,确定伪静态网站中的伪静态网页是否符合重建要求;其中,当伪静态网页的head标签下的title标签和meta标签含有预设的关键字时,确定所述伪静态网页符合重建要求;
当伪静态网页符合重建要求时,抽取网页元素白名单中含有的伪静态网页的核心元素,并根据所抽取的核心元素,对伪静态网页进行转码重建。
其中,在根据用户发送的网站访问请求中所含有的该网站的更新时间参数确定网站的结构类型的过程中,中间件截获用户发送的网站访问请求,当网站访问请求中含有Last Modified参数时,即确定网站的结构类型为伪静态网站;或者,中间件截获用户发送的网站访问请求,通过调用JS接口的document.lastmodified参数获取网站服务器的最后更新时间,如果网站服务器的最后更新时间不是当前时间,则确定网站的结构类型为伪静态网站。
其中,网页元素白名单由伪静态网页的标签下的核心元素构成,其中,标签包括body标签中的div标签和/或table标签。
根据本发明的另一方面,提供一种基于移动浏览器的网页处理系统,包括:
网站结构类型确定单元,用于根据用户发送的网站访问请求中所含有的该网站的更新时间参数,确定网站的结构类型;
网页重建确定单元,用于当网站结构类型确定单元,确定网站的结构类型为伪静态网站时,通过判断伪静态网站中的伪静态网页的head标签下的title标签和meta标签是否含有预设的关键字,确定伪静态网站中的伪静态网页是否符合重建要求;其中,当伪静态网页的head标签下的title标签和meta标签含有预设的关键字时,确定伪静态网页符合重建要求;
网页核心元素抽取单元,用于当网页重建确定单元确定伪静态网页符合重建要求时,抽取网页元素白名单中含有的伪静态网页的核心元素;
页面重建单元,用于根据核心元素抽取单元所抽取的核心元素,对伪静态网页进行转码重建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优视科技有限公司,未经优视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310744595.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抗干扰数字移动广播信号传输方法
- 下一篇:一种采用长短叶片旋流泵水力设计方法