[发明专利]一种获得网页搜索关键字的标识特征的方法及装置有效
申请号: | 201711368630.4 | 申请日: | 2017-12-18 |
公开(公告)号: | CN107871021B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 魏方征 | 申请(专利权)人: | 杭州迪普科技股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获得 网页 搜索 关键字 标识 特征 方法 装置 | ||
1.一种获得网页搜索关键字的标识特征的方法,其特征在于,所述方法包括:
获得根据用户在网页中搜索关键字生成的URL,所述URL通过解析用户设备生成的HTTP/GET报文获得,所述HTTP/GET报文包含获取搜索关键字的结果的请求;
从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;
将所述提取的至少一个字段发送至用户界面显示,以使用户根据所述搜索关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;
接收用户确认的正确字段,获得所述正确字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页搜索关键字的标识特征;
其中,基于上述步骤获得所述网页搜索关键字的标识特征后,当对用户在网页中的搜索关键字进行审计时,解析用户设备生成的HTTP/GET报文,以得到该报文的URL,在该URL中查找所述网页搜索关键字的标识特征,并提取所述开始特征与结束特征之间的数据,该数据为用户在网页中的搜索关键字。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到用户的远程更新指令、和/或审计服务器的远程更新请求的情况下,下载审计服务器中的网页域名与标识特征;
对应存储所下载的网页域名与标识特征。
4.一种基于权利要求2或3所述方法的提取网页搜索关键字方法,其特征在于,所述方法包括:
解析用户设备生成的HTTP/GET报文,得到该报文对应的网页域名与URL;
在确认所述网页域名对应的网页为待审计网页的情况下,获得预先存储的所述网页域名对应的搜索关键字的标识特征;
在所述URL中查找所述标识特征的开始特征与结束特征;
提取所述开始特征与结束特征间的数据,所述数据即为用户在所述待审计网页中的搜索关键字。
5.根据权利要求4所述的方法,其特征在于,所述在确认所述网页域名对应的网页为待审计网页的情况下,获得预先存储的所述网页域名对应的标识特征,包括:
在预先存储的网页域名中查找该报文中的网页域名;
在查找到该网页域名的情况下,确定该网页域名对应的网页为待审计网页;
获得与该网页域名预先对应存储的标识特征。
6.一种获得网页搜索关键字的标识特征的装置,其特征在于,所述装置包括:
URL获得模块,用于获得根据用户在网页中搜索关键字生成的URL,所述URL通过解析用户设备生成的HTTP/GET报文获得,所述HTTP/GET报文包含获取搜索关键字的结果的请求;
字段提取模块,用于从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;
字段显示模块,用于将所述提取的至少一个字段发送至用户界面显示,以使用户根据所述搜索关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;
特征获得模块,用于接收用户确认的正确字段,获得所述正确字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页搜索关键字的标识特征;
其中,基于上述步骤获得所述网页搜索关键字的标识特征后,当对用户在网页中的搜索关键字进行审计时,解析用户设备生成的HTTP/GET报文,以得到该报文的URL,在该URL中查找所述网页搜索关键字的标识特征,并提取所述开始特征与结束特征之间的数据,该数据为用户在网页中的搜索关键字。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
域名获得模块,用于根据接收到的所述网页的审计添加指令,获得所述网页的域名;
第一存储模块,用于在获得所述网页搜索关键字的标识特征的情况下,对应存储所述网页的域名与标识特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技股份有限公司,未经杭州迪普科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711368630.4/1.html,转载请声明来源钻瓜专利网。