[发明专利]网络内容安全检测方法、电子装置和存储介质在审
申请号: | 202011355159.7 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112733057A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 龙文洁;莫金友 | 申请(专利权)人: | 杭州安恒信息安全技术有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955;G06F16/951 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 范丽霞 |
地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 内容 安全 检测 方法 电子 装置 存储 介质 | ||
本申请涉及一种网络内容安全检测方法、电子装置和存储介质,其中,该网络内容安全检测方法包括:获取按预设数据采集方式采集的第一网络内容,其中,预设数据采集方式至少包括以下其中一种:基于网络流量进行网络内容解析、网络爬虫爬取;通过深度学习模型检测第一网络内容的第一数据,并确定第一数据与预设网络数据的相似度,其中,预设网络数据包括预设违规网络数据,并用于确定第一数据是否为非法内容;根据相似度确定网络内容安全检测结果。通过本申请,解决了网络内容检测范围有限的问题,实现了通过解析网络流量和爬虫两种方式检测网络内容,扩大了网络内容检测的范围。
技术领域
本申请涉及安全检测领域,特别是涉及网络内容安全检测方法、电子装置和存储介质。
背景技术
随着互联网、智能设备及各种新生业务的飞速发展,互联网上的数据呈现爆炸式增长,图片、视频、发文、聊天等互动内容已经成为人们表达感情、记录事件和日常工作不可或缺的部分。这些日益增长的内容中也充斥着各种不可控的风险因素,目前,对于网站以及流量中的图片以及视频的内容合规缺乏有效的检测手段。
现有网站内容安全检测装置及方法主要基于爬虫技术,检测对象来源单一且检测范围有限,无法从大规模网络流量中被动获取数据并将数据中的非法信息存储,产生网络内容检测范围有限的问题。
目前针对相关技术中网络内容检测范围有限的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种网络内容安全检测方法、电子装置和存储介质,以至少解决相关技术中网络内容检测范围有限的问题。
第一方面,本申请实施例提供了一种网络内容安全检测方法,包括:
获取按预设数据采集方式采集的第一网络内容,其中,所述预设数据采集方式至少包括以下其中一种:基于网络流量进行网络内容解析、网络爬虫爬取;
通过深度学习模型检测所述第一网络内容的第一数据,并确定所述第一数据与预设网络数据的相似度,其中,所述预设网络数据包括预设违规网络数据,并用于确定所述第一数据是否为非法内容;
根据所述相似度确定所述网络内容安全检测结果。
在其中一些实施例中,根据所述相似度确定所述网络内容安全检测结果包括:
判断所述第一数据与所述预设网络数据的所述相似度是否大于预设阈值;
在判断到所述相似度大于预设阈值的情况下,确定所述网络内容存在非法内容。
在其中一些实施例中,所述预设数据采集方式包括所述基于网络流量进行网络内容解析,获取按预设数据采集方式采集的第一网络内容包括:
获取网站访问产生的访问数据,其中,所述访问数据至少包括流量数据;
对所述流量数据按预设截取方式截取目标流量数据,其中,所述预设截取方式至少包括流量镜像;
对所述目标流量数据进行解析,至少得到第一图片数据,并确定所述第一网络内容包括所述第一图片数据。
在其中一些实施例中,对所述流量数据按预设截取方式截取目标流量数据包括:采用预设流量解释器对HTTP/HTTPS的POST请求进行拦截,获取所述目标流量数据。
在其中一些实施例中,所述预设数据采集方式包括网络爬虫爬取,获取按预设数据采集方式采集的第一网络内容包括:
采用网络爬虫至少获取第一目标网站的网站首页内容,并确定所述第一网络内容至少包括所述第一目标网站的网站首页内容。
在其中一些实施例中,所述第一网络内容包括第二图片数据,所述预设网络数据包括样本图片,通过深度学习模型检测所述第一网络内容的第一数据,并确定所述第一数据与预设网络数据的相似度包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息安全技术有限公司,未经杭州安恒信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011355159.7/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法