[发明专利]检索方法、装置和系统在审
申请号: | 201611020924.3 | 申请日: | 2016-11-21 |
公开(公告)号: | CN106776714A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 訾玲玲;丛鑫;彭晏飞 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 邓超 |
地址: | 123000*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 方法 装置 系统 | ||
技术领域
本发明涉及数字信息化技术领域,具体而言,涉及一种检索方法、装置和系统。
背景技术
随着现代信息技术的发展,信息数据的表现形式从单一的文本,发展到文本、图像、语音、视频等多种媒体信息并存。多媒体信息非结构化的数据格式、巨大的数据量以及对内容理解的主观性与多义性,使得信息检索技术面临着巨大的挑战。
传统的信息检索方法主要是基于关键字的检索方式,缺乏对用户潜在查询意图进行获取的能力。
随着检索技术的发展,语义检索被广泛应用到各个领域中,特别是信息领域。例如,采用本体概念开发的图像检索工具,构建的面向教育领域的概念映射学习系统,用于生态环境信息检索的语义服务搜素引擎等。同时,利用知识表示形式特点开发的检索系统可以分析查询结果,例如知识管理系统、本体知识获取系统等。然而,由于本体技术是通过捕获相关领域的知识,提供对该领域知识的共同理解,因此本体技术受到领域限制很大。
发明内容
有鉴于此,本发明提供了一种检索方法、装置和系统,能够准确理解用户的查询意图,且不受技术领域的限制。
第一方面,本发明实施例提供了一种检索方法,应用于搜索引擎中,包括:
当接收到的搜索信息中包括关键词和所述关键词对应的感知度时,将所述关键词与预设的主题感知树的主题节点进行匹配,得到所述关键词对应的主题节点;其中,所述感知度指示所述关键词与查询意图的匹配程度;
判断所述关键词对应的主题节点的类型,所述主题节点的类型包括连接节点和叶子节点;
根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,得到扩展词集合;
将所述扩展词集合中的词作为所述搜索信息的检索对象,进行检索。
结合第一方面,本发明实施例还提供了第一方面的第一种可能的实施方式,其中,所述预设的主题感知树的构建过程包括:
从训练数据的文档样本中获取主题词、概念词和实例词;
将所述主题词嵌入主题感知树的主题层内,根据主题词的含义设置不同类型的主题节点,包括具有子节点的连接节点和没有子节点的叶子节点;
将所述概念词嵌入主题感知树的概念层内,建立概念节点,并为主题层的叶子节点与对应的概念节点建立关联;
将所述实例词嵌入主题感知树的实例层内,建立实例节点,并为概念层的概念节点与对应的实例节点建立关联;
为每个主题节点和每个概念节点设置属性标识;
根据每个主题节点和每个概念节点的属性标识,获取每个主题节点的主题感知度、每个概念节点的概念感知度和每个实例节点的实例感知度。
结合第一方面的第一种可能的实施方式,本发明实施例还提供了第一方面的第二种可能的实施方式,其中,根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,包括:
如果所述关键词对应的主题节点的类型是叶子节点,判断用户输入的感知度的数值区间;
如果所述感知度大于0且小于1,则查找所述主题节点对应的所有概念节点和所有实例节点,找到所有实例感知度大于所述感知度的实例节点;
如果所述感知度大于1,从所述主题节点的父节点对应的所有子节点中,查找主题感知度满足预设条件的节点对应的概念节点和实例节点;所述父节点为所述主题节点对应的连接节点;
如果所述关键词所对应的主题节点的类型是连接节点,判断用户输入的感知度的数值区间;
如果所述感知度大于0且小于1,从所述主题节点的子节点中,查找主题感知度满足预设条件的节点对应的概念节点和实例节点;
如果所述感知度大于1,从所述主题节点的父节点及所述父节点对应的所有子节点中,查找主题感知度满足预设条件的节点所对应的概念节点和实例节点;
将上述步骤中获取的实例节点作为扩展词存入扩展词集合。
结合第一方面,本发明实施例还提供了第一方面的第三种可能的实施方式,其中,在将所述关键词与预存的主题感知树的主题节点进行匹配之前,所述方法还包括:
对所述关键词进行预处理,提取所述关键词中的实词;
将提取的所述实词作为新的关键词。
结合第一方面的第三种可能的实施方式,本发明实施例还提供了第一方面的第四种可能的实施方式,其中,对所述关键词进行预处理,包括:
采用非空探测方法和/或中文分词方法对所述关键词进行预处理。
第二方面,本发明实施例还提供一种检索装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611020924.3/2.html,转载请声明来源钻瓜专利网。