[发明专利]显示网页内容的方法、装置、终端及存储介质有效
申请号: | 201711202503.7 | 申请日: | 2017-11-27 |
公开(公告)号: | CN109948095B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张枫枫;孟德全;胡晶晶 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 显示 网页 内容 方法 装置 终端 存储 介质 | ||
1.一种显示网页内容的方法,其特征在于,应用于应用客户端,所述方法包括:
显示收藏的至少一个网页的收藏条目,任一网页的所述收藏条目中包括所述任一网页的网页地址;
根据被选中的第一网页的网页地址,获取所述第一网页的网页元素;
根据所述网页元素,构建所述第一网页的拓扑结构,所述拓扑结构的每个元素节点对应于一个网页元素;
在所述拓扑结构中确定第一类标签对应的元素节点,和/或,在所述拓扑结构中确定第二类标签对应的元素节点,所述第一类标签包括引用标签、表格标签和/或代码块标签,所述第二类标签包括自定义标签,所述自定义标签包括音频标签、视频标签和/或图片标签;
将所述第一类标签对应的元素节点和/或所述第二类标签对应的元素节点作为第一元素节点,将所述拓扑结构中除所述第一元素节点之外的其他元素节点确定为第二元素节点,所述第一元素节点为所述第一网页的非文本内容的元素节点,所述第二元素节点为所述第一网页的文本内容的元素节点;
从所述第一元素节点的节点标签中获取所述非文本内容,从所述第二元素节点的节点标签中获取所述文本内容;
显示符合预设格式的第二网页,所述第二网页包括所述非文本内容和所述文本内容;
所述方法还包括:
获取所述第一网页的来源应用的应用标识;
从应用标识和第一类标签的对应关系中,确定与所述来源应用的应用标识对应的第一类标签,和/或从应用标识和第二类标签的对应关系中确定与所述来源应用的应用标识对应的第二类标签,不同的应用程序对应不同的第一类标签和第二类标签。
2.根据权利要求1所述的方法,其特征在于,从所述第一网页的网页内容中确定所述非文本内容和所述文本内容之前,所述方法还包括:
在所述网页元素中确定非内容网页元素,在所述网页元素中将所述非内容网页元素删除。
3.根据权利要求1所述的方法,其特征在于,所述显示符合预设格式的第二网页,所述第二网页包括所述非文本内容和所述文本内容,包括:
将所述非文本内容和所述文本内容组成所述第二网页的网页内容;
从所述第二网页的网页内容中识别出正文内容;
显示符合预设格式的所述第二网页的正文内容。
4.根据权利要求3所述的方法,其特征在于,所述从所述第二网页的网页内容中识别出正文内容,包括:
通过预设正则表达式,从所述第二网页的网页内容中识别出所述正文内容,所述预设正则表达式用于识别网页内容中的正文内容;和/或,
确定所述第二网页的每个元素节点的权重,根据所述每个元素节点的权重,确定第一指定元素节点,从所述第二网页的网页内容中确定所述第一指定元素节点对应的第一节点内容,将所述第一节点内容作为所述正文内容。
5.根据权利要求4所述的方法,其特征在于,确定所述第二网页的网页内容的每个元素节点的权重,包括:
确定所述每个元素节点的标签类型和每个元素节点对应的节点内容包括的字数;
根据所述每个元素节点的标签类型,确定所述每个元素节点的第一权重;
根据所述每个元素节点对应的节点内容包括的字数,确定所述每个元素节点的第二权重;
根据所述每个元素节点的第一权重和第二权重,确定所述每个元素节点的权重。
6.根据权利要求4所述的方法,其特征在于,所述通过预设正则表达式,从所述第二网页的网页内容中识别出所述正文内容,包括:
通过所述预设正则表达式,从所述第二网页的元素节点中识别出第二指定元素节点;
从所述第二网页的网页内容中确定所述第二指定元素节点对应的第二节点内容,将所述第二节点内容作为所述正文内容。
7.根据权利要求1-6任一所述的方法,其特征在于,所述获取所述第一网页的网页元素,包括:
响应于查看指令,根据所述查看指令,显示收藏的至少一个网页的网页地址;
从所述至少一个网页的网页地址中,获取所述被选中的第一网页的网页地址;
从所述第一网页的网页地址中,获取所述第一网页的网页元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711202503.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种WEB页面加载方法及装置
- 下一篇:一种网页活动配置系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法