[发明专利]一种获得网页搜索关键字的标识特征的方法及装置有效
申请号: | 201711368630.4 | 申请日: | 2017-12-18 |
公开(公告)号: | CN107871021B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 魏方征 | 申请(专利权)人: | 杭州迪普科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获得 网页 搜索 关键字 标识 特征 方法 装置 | ||
本申请提供一种获得网页搜索关键字的标识特征的方法,其特征在于,所述方法包括:获得根据用户在网页中搜索的关键字生成的URL;从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;将解析得到的至少一个字段发送至用户界面显示,以使用户根据所搜索的关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;接收用户确认的正确字段,获得该字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页的标识特征。应用本申请方案,可以灵活地根据实际需求获得网页搜索关键字的标识特征。
技术领域
本申请涉及互联网技术领域,尤其涉及一种获得网页搜索关键字的标识特征的方法及装置。
背景技术
随着网络技术的发展,对用户在网页中搜索的关键字进行审计,从而保障网络安全的需求日益增加。用户在网页中进行搜索时,将生成HTTP/GET报文发送至网页服务器,该报文的URL中包括并通过某种形式的特征标识了用户输入的关键字,因此通过解析URL数据,即可提取用户所搜索的关键字进行审计。然而,不同网页所使用的标识特征没有统一的标准,因此在对某一网页进行搜索关键字审计前,首先需要获得该网页的关键字标识特征。
现有技术中,通常是由专业的技术工程师分析常用的搜索引擎、门户网站等网页的搜索URL数据,提取网页的标识特征,在审计设备出厂时内置这些常用网页的标识特征,并由专业的分析团队长期地为用户提供常用网页及其标识特征的更新补丁。显然这种方式灵活性较差,一方面只能满足用户的一般需求,对于针对性较强的、较为小众的网页,如专业性网站、学校内部论坛等类别的网页,无法提供全面的审计覆盖,另一方面,定期提供更新补丁的方式,也无法适应互联网中的网页与资讯的更新速度,审计效果较差。
发明内容
有鉴于此,本申请提供一种获得网页搜索关键字的标识特征的方法及装置,技术方案如下:
根据本申请的第一方面,提供一种获得网页搜索关键字的标识特征的方法,该方法包括:
获得根据用户在网页中搜索的关键字生成的URL;
从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;
将解析得到的至少一个字段发送至用户界面显示,以使用户根据所搜索的关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;
接收用户确认的正确字段,获得该字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页的标识特征。
根据本申请的第二方面,提供一种基于前述网页标识特征的网页搜索关键字提取方法,该方法包括:
解析用户设备生成的HTTP/GET报文,得到该报文中的网页域名与URL;
在确认所述网页域名对应的网页为待审计网页的情况下,获得预先存储的所述网页域名对应的标识特征;
在该URL中查找该标识特征的开始特征与结束特征;
提取开始特征与结束特征间的数据,所述数据即为用户在该网页中搜索的关键字。
根据本申请的第三方面,提供一种获得网页搜索关键字的标识特征的装置,该装置包括:
URL获得模块,用于获得根据用户在网页中搜索的关键字生成的URL;
字段提取模块,用于从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;
字段显示模块,用于将解析得到的至少一个字段发送至用户界面显示,以使用户根据所搜索的关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;
特征获得模块,用于接收用户确认的正确字段,获得该字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页的标识特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技股份有限公司,未经杭州迪普科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711368630.4/2.html,转载请声明来源钻瓜专利网。