[发明专利]网页编码格式的确定方法和装置有效
| 申请号: | 201710784883.3 | 申请日: | 2017-09-01 |
| 公开(公告)号: | CN110020343B | 公开(公告)日: | 2021-03-30 |
| 发明(设计)人: | 张野 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
| 地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网页 编码 格式 确定 方法 装置 | ||
本申请公开了一种网页编码格式的确定方法和装置。其中,该方法包括:获取统一资源定位符URL,其中,所述URL对应的网页为目标网页;根据所述URL和预设的字段内容确定所述目标网页的编码格式;根据所述URL和字符串转化方式确定所述目标网页的编码格式;判断根据所述URL和预设的字段内容确定出的所述目标网页的编码格式与根据所述URL和字符串转化方式确定出的所述目标网页的编码格式是否相同;根据判断结果确定所述目标网页的编码格式。通过本申请,解决了相关技术中确定网页的编码格式时效率较低的技术问题。
技术领域
本申请涉及网页技术领域,具体而言,涉及一种网页编码格式的确定方法和装置。
背景技术
相关技术中,在对网页的编码格式进行判断时,一般是通过鼠标点击网页中一个插件,通过该插件选择查看该网页的代码,然后就需要用户对网页代码进行仔细阅读,从而确定网页中代码的编码格式。但是,上述的网页编码格式的判断方式,需要用户逐行查看网页代码,需要较长的时间,而且效率较低。
针对相关技术中确定网页的编码格式时效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种网页编码格式的确定方法,以解决相关技术中确定网页的编码格式时效率较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种网页编码格式的确定方法。该方法包括:获取统一资源定位符URL,其中,所述URL对应的网页为目标网页;根据所述URL和预设的字段内容确定所述目标网页的编码格式;根据所述URL和字符串转化方式确定所述目标网页的编码格式;判断根据所述URL和预设的字段内容确定出的所述目标网页的编码格式,与根据所述URL和字符串转化方式确定出的所述目标网页的编码格式是否相同;根据判断结果确定所述目标网页的编码格式。
进一步地,根据所述URL和字符串转化方式确定所述目标网页的编码格式包括:将所述目标网页转化为字符串格式的页面;采用第一预设编码格式将所述字符串格式的页面转换为字节流;采用第二预设编码格式将所述字节流转换为目标字符串;根据所述目标字符串中是否包括预设格式类型的字符判定所述目标网页的编码格式。
进一步地,所述预设格式类型的字符为中文字符,根据所述目标字符串中是否包括预设格式类型的字符判定所述目标网页的编码格式包括:若所述目标字符串中包括中文字符,确定所述目标网页的编码格式为UTF-8;若所述目标字符串中不包括中文字符,确定所述目标网页的编码格式为GBK或GB2312。
进一步地,根据判断结果确定所述目标网页的编码格式包括:若所述判断结果为相同,将根据所述URL和预设的字段内容确定出的所述目标网页的编码格式或根据所述URL或预设字符串转化方式确定出的所述目标网页的编码格式作为所述目标网页的编码格式;若所述判断结果为不同,将根据所述URL和预设字符串转化方式确定出的所述目标网页的编码格式作为所述目标网页的编码格式。
进一步地,根据所述URL和预设的字段内容确定所述目标网页的编码格式包括:提取所述预设的字段内容中的预设目标字符串;根据提取的所述预设目标字符串和所述URL,确定出所述目标网页的编码格式。
为了实现上述目的,根据本申请的另一方面,提供了一种网页编码格式的确定装置。该装置包括:获取单元,用于获取统一资源定位符URL,其中,所述URL对应的网页为目标网页;第一确定单元,用于根据所述URL和预设的字段内容确定所述目标网页的编码格式;第二确定单元,用于根据所述URL和字符串转化方式确定所述目标网页的编码格式;判断单元,用于判断根据所述URL和预设的字段内容确定出的所述目标网页的编码格式,与根据所述URL和字符串转化方式确定出的所述目标网页的编码格式是否相同;第三确定单元,用于根据判断结果确定所述目标网页的编码格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710784883.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据的处理方法及装置
- 下一篇:一种网页页面元素标注方法及系统





