[发明专利]检索方法、装置和系统在审
申请号: | 201611020924.3 | 申请日: | 2016-11-21 |
公开(公告)号: | CN106776714A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 訾玲玲;丛鑫;彭晏飞 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 邓超 |
地址: | 123000*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 方法 装置 系统 | ||
1.一种检索方法,应用于搜索引擎中,其特征在于,包括:
当接收到的搜索信息中包括关键词和所述关键词对应的感知度时,将所述关键词与预设的主题感知树的主题节点进行匹配,得到所述关键词对应的主题节点;其中,所述感知度指示所述关键词与查询意图的匹配程度;
判断所述关键词对应的主题节点的类型,所述主题节点的类型包括连接节点和叶子节点;
根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,得到扩展词集合;
将所述扩展词集合中的词作为所述搜索信息的检索对象,进行检索。
2.根据权利要求1所述的方法,其特征在于,所述预设的主题感知树的构建过程包括:
从训练数据的文档样本中获取主题词、概念词和实例词;
将所述主题词嵌入主题感知树的主题层内,根据主题词的含义设置不同类型的主题节点,包括具有子节点的连接节点和没有子节点的叶子节点;
将所述概念词嵌入主题感知树的概念层内,建立概念节点,并为主题层的叶子节点与对应的概念节点建立关联;
将所述实例词嵌入主题感知树的实例层内,建立实例节点,并为概念层的概念节点与对应的实例节点建立关联;
为每个主题节点和每个概念节点设置属性标识;
根据每个主题节点和每个概念节点的属性标识,获取每个主题节点的主题感知度、每个概念节点的概念感知度和每个实例节点的实例感知度。
3.根据权利要求2所述的方法,其特征在于,根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,包括:
如果所述关键词对应的主题节点的类型是叶子节点,判断用户输入的感知度的数值区间;
如果所述感知度大于0且小于1,则查找所述主题节点对应的所有概念节点和所有实例节点,找到所有实例感知度大于所述感知度的实例节点;
如果所述感知度大于1,从所述主题节点的父节点对应的所有子节点中,查找主题感知度满足预设条件的节点对应的概念节点和实例节点;所述父节点为所述主题节点对应的连接节点;
如果所述关键词所对应的主题节点的类型是连接节点,判断用户输入的感知度的数值区间;
如果所述感知度大于0且小于1,从所述主题节点的子节点中,查找主题感知度满足预设条件的节点对应的概念节点和实例节点;
如果所述感知度大于1,从所述主题节点的父节点及所述父节点对应的所有子节点中,查找主题感知度满足预设条件的节点所对应的概念节点和实例节点;
将上述步骤中获取的实例节点作为扩展词存入扩展词集合。
4.根据权利要求1所述的方法,其特征在于,
在将所述关键词与预存的主题感知树的主题节点进行匹配之前,所述方法还包括:
对所述关键词进行预处理,提取所述关键词中的实词;
将提取的所述实词作为新的关键词。
5.根据权利要求4所述的方法,其特征在于,对所述关键词进行预处理,包括:
采用非空探测方法和/或中文分词方法对所述关键词进行预处理。
6.一种检索装置,其特征在于,包括:
节点匹配模块,用于当接收到的搜索信息中包括关键词和所述关键词对应的感知度时,将所述关键词与预设的主题感知树的主题节点进行匹配,得到所述关键词对应的主题节点;其中,所述感知度指示所述关键词与查询意图的匹配程度;
节点类型判断模块,用于判断所述关键词对应的主题节点的类型,所述主题节点的类型包括连接节点和叶子节点;
扩展词获取模块,根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,得到扩展词集合;
检索模块,将所述扩展词集合中的词作为所述搜索信息的检索对象,进行检索。
7.根据权利要求6所述的装置,其特征在于,所述扩展词获取模块包括:
叶子节点处理单元,用于在所述关键词对应的主题节点的类型是叶子节点时,根据用户输入的感知度查找对应的实例节点;
连接节点处理单元,用于在所述关键词对应的主题节点的类型是连接节点时,根据用户输入的感知度查找对应的实例节点。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
关键词预处理模块,用于对所述关键词进行预处理,提取所述关键词中的实词;将提取的所述实词作为新的关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611020924.3/1.html,转载请声明来源钻瓜专利网。