[发明专利]一种无线网页转码方法及装置有效
申请号: | 201110406410.2 | 申请日: | 2011-12-08 |
公开(公告)号: | CN103166981B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 朱靖君;杨巍;林世飞;张富强 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F17/30 |
代理公司: | 北京派特恩知识产权代理有限公司11270 | 代理人: | 程立民,张颖玲 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 无线 网页 方法 装置 | ||
技术领域
本发明涉及无线网络技术领域,尤其涉及一种无线网页转码方法及装置。
背景技术
近年来,越来越多的人使用移动终端来浏览网页,然而移动终端的屏幕较小,一般的WEB页面是二维的,而移动终端屏幕只够显示一维的页面,所以WEB页面在移动终端中一般都显得过大,得不到较好的展示;一般的WEB页面是按照超文本标识语言HTML标准来编写的,而移动终端的浏览器通常只适用于无线应用协议(Wireless Application Protocol,WAP)页面(即WAP 1.0和WAP 2.0页面)的展示,因此很多WEB页面都无法在手机等移动终端的浏览器中展示;另外,无线网络的连接速度目前还不及有线网络,WEB页面有时会比较大,在有线网络中传输没问题,但是在无线网络中传输却会比较慢,用户很长时间都打不开网页,也就得不到想要的信息,影响了用户体验。因此,需要一种能够将WEB页面转换为WAP页面的方法,使得WEB网页在移动终端中也能得到很好的展示。而且还必须能够分别输出WAP 1.0和WAP 2.0页面,因为有些低端移动终端的浏览器是不支持WAP 2.0页面。
目前一些移动终端的浏览器如UC浏览器和QQ手机浏览器对于WEB页面都将其由二维转换为一维的,即原来的多列布局都变为单列的,并且有分页的处理。而一些主要的搜索引擎例如Google和Baidu在其无线搜索引擎中都提供了WEB页面到WAP页面转换的服务,方便用户在移动终端的浏览器中查看搜索结果页面。
UC浏览器和QQ手机浏览器的转换效果还不是很好,文字和图片的排列还存在较多的问题,显得不够整齐,而且有些页面上的冗余信息也没有去掉。而Google和Baidu的转换效果相对较好,但是有时候会把页面中的一些重要信息也去掉,造成用户无法获得这些重要信息,而且在分页方面还存在问题,没有尽量保证同一行或是同一段落文本的完整性。
发明内容
有鉴于此,本发明提供一种无线网页转码方法及装置,解决了WEB页面在移动终端中的展示问题。
为达到上述目的,本发明的技术方案是这样实现的:
一种无线网页转码方法,该方法包括:
对WEB网页的超文本标识语言HTML源码进行解析,建立文档对象模型DOM树;
通过所述DOM树对所述WEB网页的内容进行分类;
通过所述DOM树对所述WEB网页的内容进行分块;
根据所述WEB网页的分类和分块结果对所述WEB网页进行重新排版;
将排版后的WEB网页按无线应用协议WAP标准输出WAP页面。
进一步地,对所述WEB网页的内容进行分类具体为:
通过页面中链接文本占总文本的比例判断网页是信息页还是索引页;或
通过所述WEB网页中包含的关键字判断所述WEB网页的具体类型。
进一步地,对所述WEB网页的内容进行分块具体为:
根据标签节点内容中所包含的关键字、标签节点内容的文本长度、标签节点内容中所包含的链接文本长度中的至少一个对WEB网页的内容进行分块以及对块的类型进行识别。
进一步地,进行所述重新排版时,根据所述WEB网页分类和分块的结果确定对所述WEB网页进行重新排版的排版方式,基于所确定的排版方式对所述WEB网页进行重新排版,所述排版方式包括:
全重排,该排版方式下,所述WEB网页的全部内容都保留;
拼接重排,该排版方式将重要的块拼接为结果页面,将不重要的块去掉;
网页块重排,该排版方式展示WEB页面中重要的块,对于不重要的块则做折叠处理。
进一步地,所述根据所述WEB网页分类和分块的结果对网页进行重新排版具体为:
根据所述WEB网页分块的结果对DOM树中的各个节点进行标记,并根据配置文件决定各节点所在块的展示方式;
基于WAP标准对所述WEB网页中的层叠样式表CSS样式进行整理;
对所述WEB网页中的图片进行缩小处理,更换图片链接地址;
根据WAP页面所支持的可扩展超文本标识语言XHTML标准对所述WEB网页中的HTML标签进行处理;
所述按无线应用协议WAP标准输出WAP页面具体为:将经过标签处理后的DOM树按WAP标准输出WAP页面。
进一步地,所述方法还包括:对输出的WAP页面进行分页处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110406410.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:混合动力工程机械
- 下一篇:以重组的三股螺旋支架为基础的复合物