[发明专利]一种确定页面可读性的方法和服务器无效
| 申请号: | 201210104882.7 | 申请日: | 2012-04-11 |
| 公开(公告)号: | CN103365935A | 公开(公告)日: | 2013-10-23 |
| 发明(设计)人: | 朱靖君;林世飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/22 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 黄厚刚 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 确定 页面 可读性 方法 服务器 | ||
1.一种确定页面可读性的方法,其特征在于,所述方法包括:
获取无线应用协议wap页面的页面信息;
在所述wap页面中获取影响所述wap页面可读性的特征项信息;
根据所述wap页面的页面信息和所述特征项信息,确定所述wap页面的可读性。
2.如权利要求1所述的方法,其特征在于,所述获取无线应用协议wap页面的页面信息,具体包括:
获取所述wap页面中的文本内容和所述文本内容的总字节数;
提取所述wap页面中的换行标识,根据所述换行标识确定所述wap页面的总段落数以及每段落的字节数;
将所述wap页面中的文本内容、所述文本内容的总字节数、所述wap页面的总段落数以及每段落的字节数作为所述wap页面的页面信息。
3.如权利要求1所述的方法,其特征在于,所述在所述wap页面中获取影响所述wap页面可读性的特征项信息,具体包括:
根据所述wap页面中的文本内容,获取所述wap页面中的所述终极电子布告栏UBB代码;
根据所述wap页面中的文本内容,获取所述wap页面中的所述客户端脚本语言JavaScript代码和层叠样式表Css代码;
根据所述wap页面中的每段落的字节数,获取所述wap页面中的所述字节数超过预设阈值的段落;
根据所述wap页面中的文本内容,获取所述wap页面中的所述不可用统一资源定位符URL链接;
根据所述wap页面中的文本内容,获取所述wap页面中的所述乱码字符;
将所述UBB代码、所述JavaScript代码和Css代码、所述字节数超过预设阈值的段落、所述不可用URL链接、所述乱码字符作为特征项信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述wap页面的页面信息和所述特征项信息,确定所述wap页面的可读性,具体包括:
根据所述wap页面的文本内容的总字节数和所述UBB代码的字节数,确定所述UBB代码的可读性;
根据所述wap页面的文本内容的总字节数和所述JavaScript和Css代码的字节数,确定所述JavaScript和Css代码的可读性;
根据所述wap页面的总段落数和所述字节数超过预设阈值的段落的数量,确定所述字节数超过预设阈值的段落的可读性;
根据所述wap页面的文本内容的总字节数和所述不可用URL链接的字节数,确定所述不可用URL链接的可读性;
根据所述wap页面的文本内容的总字节数和所述乱码字符的字节数,确定所述乱码字符的可读性;
根据确定得到的至少一种特征项信息的可读性,确定所述wap页面的可读性。
5.一种确定页面可读性的服务器,其特征在于,所述服务器包括:
第一获取模块,用于获取无线应用协议wap页面的页面信息;
第二获取模块,用于在所述wap页面中获取影响所述wap页面可读性的特征项信息;
可读性确定模块,用于根据所述wap页面的页面信息和所述特征项信息,确定所述wap页面的可读性。
6.如权利要求5所述的服务器,其特征在于,所述第一获取模块,具体包括:
第一获取单元,用于获取所述wap页面中的文本内容和所述文本内容的总字节数;
第一处理单元,用于提取所述wap页面中的换行标识,根据所述换行标识确定所述wap页面的总段落数以及每段落的字节数;
第二处理单元,用于将所述wap页面中的文本内容、所述文本内容的总字节数、所述wap页面的总段落数以及每段落的字节数作为所述wap页面的页面信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210104882.7/1.html,转载请声明来源钻瓜专利网。





