[发明专利]信息处理方法、装置、电子设备及存储介质在审
| 申请号: | 201911373456.1 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111209459A | 公开(公告)日: | 2020-05-29 |
| 发明(设计)人: | 侯姗姗;秦俊锋;杨梦茹;张云蕾;周一枫 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951 |
| 代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
| 地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 方法 装置 电子设备 存储 介质 | ||
本发明实施例涉及网页技术领域,公开了一种信息处理方法,包括:获取待检测网址以及获取所述待检测网址的链接网址;爬取所述待检测网址和所述链接网址,得到爬虫结果;识别所述爬虫结果中是否存在特征信息;若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。本发明还提出一种信息处理装置、电子设备以及一种计算机可读存储介质。本发明提供的信息处理方法、信息处理装置、电子设备以及计算机可读存储介质可以快速检测到网页中存在的特征信息,提高网页特征信息检测结果的可靠性。
技术领域
本发明实施例涉及网页技术领域,特别涉及一种信息处理方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,网页的数量呈现爆发式增长,网页内的信息也越来越丰富。目前很多网页都添加了合作伙伴等第三方的站点链接,发明人发现,这些站点链接上的信息存在不可控性,当用户访问网页时若跳转至存在非法信息的站点,将极大的降低用户体验,甚至可能带来用户信息的泄露。但目前,通常通过人工审核的方式对网页及网页添加的第三方的站点链接是否存在不恰当的信息进行审核,由于通常第三方的站点链接会跟随热点更改,因此,通常需要在短时间内对大量信息进行审核,这种人工审核的方式效率不高,并且由于效率不高也会带来审核结果误差率高的问题,从而导致对网页内容检测结果的可靠性不高。
发明内容
本发明实施方式的目的在于提供一种信息处理方法、装置、电子设备及计算机可读存储介质,可以快速检测到网页中存在的特征信息,提高网页特征信息检测结果的可靠性。
为解决上述技术问题,本发明的实施方式提供了一种信息处理方法,所述方法包括:获取待检测网址以及获取所述待检测网址的链接网址;爬取所述待检测网址和所述链接网址,得到爬虫结果;识别所述爬虫结果中是否存在特征信息;若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。
本发明的实施方式还提供了一种信息处理装置,所述装置包括:获取模块,用于获取待检测网址以及获取所述待检测网址的链接网址;爬虫模块,用于爬取所述待检测网址和所述链接网址,得到爬虫结果;识别模块,用于识别所述爬虫结果中是否存在特征信息;保存模块,用于若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。
本发明的实施方式还提供了一种电子设备,所述电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的信息处理方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述信息处理。
本发明实施方式相对于现有技术而言,其获取待检测网址以及获取所述待检测网址的链接网址;爬取所述待检测网址和所述链接网址,得到爬虫结果;识别所述爬虫结果中是否存在特征信息;若所述爬虫结果中存在特征信息,将所述爬虫结果中的特征信息保存至区块链中。通过爬取待检测网址,从而能够快速全面的获取到待检测网址和链接网址的信息并识别是否存在特征信息,提高了检测网页中是否存在特征信息的效率和准确率,降低了错误率,提高了网页特征信息检测结果的可靠性,并且,本发明将准确的识别结果保存到不可被篡改的区块链中,进一步提高了网页特征信息检测结果的可靠性。
进一步地,本发明通过递归爬取待检测网址的方式,可以尽可能多的获取到链接网址,从而能够更加全面的获取到点击待检测网址之后的可能浏览到的页面信息,可以更全面的识别到特征信息是否存在,有利于提高检测的准确率。
优选地,所述获取所述待检测网址的链接网址包括:递归爬取所述待检测网址,得到所述待检测链接网址的链接网址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911373456.1/2.html,转载请声明来源钻瓜专利网。





