[发明专利]垂直搜索方法有效
| 申请号: | 201410328560.X | 申请日: | 2011-09-29 |
| 公开(公告)号: | CN104063514B | 公开(公告)日: | 2018-06-01 |
| 发明(设计)人: | 赵轶;许小东 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 条目 垂直搜索 分类条目 相关信息 查询词 网络技术领域 分类数据库 相似度确定 次数比率 匹配结果 用户关注 分类 词法 加权 申请 匹配 网页 概率 统计 分析 | ||
1.一种垂直搜索方法,其包括:
获取用户端选择的一行业中输入的查询词;
根据所述查询词与分类数据库中的该行业已分类的各条目匹配的结果,获取各类别与查询词相关的条目,并按类别将各所述类别的条目及相关信息展现给用户,其中,所述的条目为电子商务网页中的一项或多项业务内容;
其中,首先采用将各条目中的关键词与该行业各类别对应的关键词的词法匹配结果进行加权分析确定各条目所属类别;当在阈值时间内,通过匹配规则分类法无法将某个条目进行分类时,则根据未分类条目的各关键词的出现次数比率与根据预先统计获得的已分类条目的各关键词的出现概率的相似度确定各条目所属类别;
进一步地,所述根据未分类条目的各关键词的出现次数比率与根据预先统计获得的已分类条目的各关键词的出现概率的相似度确定各条目所属类别,包括:
获取所有影响条目分类的相关关键词,针对已分类的条目,统计所述相关关键词中在该已分类的条目中存在的关键词和不存在的关键词,从而获得已分类的条目的各关键词的出现概率;针对未分类的条目,统计所述相关关键词中在该已分类的条目中存在的关键词和不存在的关键词,获得未分类条目的各关键词的出现次数比率;再对比已分类条目的各关键词的出现概率和未分类条目的各关键词的出现次数比率获得相似度,以所述相似度确认未分类条目所属的分类。
2.根据权利要求1所述的方法,其中,该行业已分类的各条目通过下面步骤获得:
获取所述行业所有网页的所有条目及相关信息;
将各条目中的关键词与该行业各类别对应的关键词的词法匹配结果进行加权分析确定各条目所属类别;
和/或,根据未分类条目的各关键词的出现次数比率与根据预先统计获得的已分类条目的各关键词的出现概率的相似度确定各条目所属类别。
3.根据权利要求1至2中任一项所述的方法,其中,所述查询词包括:用户的输入的关键词或者用户选择的根据该用户的输入词返回的建议词中的一个;其中,
所述的建议词通过预先统计的用户输入的输入词与对应结果的点击关系提取获得。
4.根据权利要求1至2中任一项所述的方法,还包括安全检测步骤,其包括:
步骤A、对于所述获取的待分类的每个条目所在的链接地址,通过安全检查引擎和木马查杀引擎检查所述链接地址是否安全,如果安全,则对所述条目进行分类;
和/或,步骤B,对于所述分类数据库中的已分类的条目所在的链接地址,通过安全检查引擎不断遍历每个链接地址,如果不安全,则将该链接地址的相关数据从分类数据库中删除;
和/或,步骤C,对于用户点击的一条目所在的链接地址,通过安全检查引擎检查该链接地址是否安全,如果不安全,则提示用户并在分类数据库中将该链接地址的相关数据删除。
5.根据权利要求3所述的方法,还包括安全检测步骤,其包括:
步骤A、对于所述获取的待分类的每个条目所在的链接地址,通过安全检查引擎和木马查杀引擎检查所述链接地址是否安全,如果安全,则对所述条目进行分类;
和/或,步骤B,对于所述分类数据库中的已分类的条目所在的链接地址,通过安全检查引擎不断遍历每个链接地址,如果不安全,则将该链接地址的相关数据从分类数据库中删除;
和/或,步骤C,对于用户点击的一条目所在的链接地址,通过安全检查引擎检查该链接地址是否安全,如果不安全,则提示用户并在分类数据库中将该链接地址的相关数据删除。
6.根据权利要求4所述的方法,其中,通过安全检查引擎和木马查杀引擎检查所述链接地址是否安全的过程进一步包括:
步骤P1,对于所述获取的待分类的每个条目所在的链接地址,将该链接地址提交给安全检查引擎检查其是否在安全等级库中存在;
步骤P2,如果存在并安全,则对所述条目进行分类;
步骤P3,如果存在但不安全,则发送警告信息,并过滤掉该链接地址的相关数据;
步骤P4,如果不存在,则通过木马查杀引擎检查该链接地址,判断该链接是否安全,如果安全,将该链接地址存入安全等级库,并转入步骤P1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410328560.X/1.html,转载请声明来源钻瓜专利网。





