[发明专利]一种网站页面的链接过滤方法、装置、设备及介质在审
申请号: | 201810994917.6 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109145214A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 张志良 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 链接过滤 网站地址 标签 链接 源代码 过滤 获取目标 目标链接 人工方式 人力成本 网站页面 预设标准 预先设置 浏览器 加载 预设 判定 记录 | ||
本发明公开了一种网站页面的链接过滤方法、装置、设备及介质,该方法的步骤包括:依照预设的网站地址,获取与网站地址对应的网站页面的源代码;在源代码中提取包含有链接的超文本标签,并对满足预设标准的超文本标签进行过滤,以得到目标超文本标签;获取并记录各目标超文本标签中的目标链接,以当浏览器加载网站页面时,仅允许获取或禁止获取目标链接的内容。本方法仅需要人为的预先设置网站地址以及用于进行过滤判定的标准即可,降低了通过人工方式逐一设置需要过滤的链接的操作复杂性,并且降低了人力成本开销。此外,本发明还提供一种网站页面的链接过滤装置、设备及介质,有益效果同上所述。
技术领域
本发明涉及网络安全领域,特别是涉及一种网站页面的链接过滤方法、装置、设备及介质。
背景技术
伴随着网络技术的进步以及网络普及率的提升,越来越多的用户能够以互联网的方式高效的获取到所需的内容信息,并且网站(即网络站点)页面所能够呈现的内容信息往往较为丰富。
为了对网站页面的内容实现高效的维护或更新,企业在对网站进行开发时,往往会依照预设排版,将各动态内容的链接以超文本标签的形式集成在网站页面的源代码中,当浏览器加载网站页面的内容时,会根据页面源代码中各个链接获取相应的实时内容信息并依照预设排版组合为完整的网站页面。
但是当前的网站页面中通常会存在有与该网站的内容主旨或用户需求无关的链接,如第三方网站的跳转链接或广告链接等,因此网络管理员往往需要对网站页面中的无关链接进行过滤,以确保浏览器所加载的网站页面中仅显示网站内部链接对应的内容。
当前已有一种基于HTTP协议对于网站页面中的第三方链接进行过滤的方法,是预先在网关设备中设置网站地址,即对该网站地址所对应页面中的链接进行过滤,进而通过捕获并分析PC端与HTTP服务器之间通信的HTTP请求头,当判定HTTP请求头中HOST字段的内容为预先设置的网站地址或referer字段中的内容为预先设置的网站地址时,均放通该HTTP请求进行相应链接内容的访问。但是随着网络安全的不断提高,对传输数据进行加密的HTTPS协议逐渐取代了通过明文方式传输数据的HTTP协议,因此上述方法不再适用于HTTPS协议的场景,只能依靠网络管理员以人工的方式逐一设置网站页面中需要过滤的链接,操作复杂,并且需要较高的人力成本。
由此可见,提供一种网站页面的链接过滤方法,以降低通过人工操作实现链接过滤的复杂性,并且降低人力成本开销,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种网站页面的链接过滤方法、装置、设备及介质,以降低通过人工操作实现链接过滤的复杂性,并且降低人力成本开销。
为解决上述技术问题,本发明提供一种网站页面的链接过滤方法,包括:
依照预设的网站地址,获取与网站地址对应的网站页面的源代码;
在源代码中提取包含有链接的超文本标签,并对满足预设标准的超文本标签进行过滤,以得到目标超文本标签;
获取并记录各目标超文本标签中的目标链接,以当浏览器加载网站页面时,仅允许获取或禁止获取目标链接的内容。
优选的,对满足预设标准的超文本标签进行过滤,以得到目标超文本标签具体为:
对满足包含有预设标签属性的超文本标签进行过滤,以得到目标超文本标签。
优选的,在对满足包含有预设标签属性的超文本标签进行过滤,以得到目标超文本标签后,该方法进一步包括:
获取未包含有预设标签属性的无关超文本标签;
提取无关超文本标签中的无关链接,并将无关链接记录至预设日志中。
优选的,获取并记录各目标超文本标签中的目标链接具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810994917.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于历史信息的查询推荐方法及装置
- 下一篇:网络舆情分析方法、装置及存储介质