[发明专利]一种模糊语义搜索方法、系统及设备无效
| 申请号: | 200810093969.2 | 申请日: | 2008-04-24 |
| 公开(公告)号: | CN101566988A | 公开(公告)日: | 2009-10-28 |
| 发明(设计)人: | 文坤梅;李瑞轩;孙小林;张翼 | 申请(专利权)人: | 华为技术有限公司;华中科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京挺立专利事务所 | 代理人: | 叶树明 |
| 地址: | 518129广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模糊 语义 搜索 方法 系统 设备 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种模糊语义搜索方法、系统及设备。
背景技术
Web(网络)搜索技术已经得到了普及应用,但查全率和精确度仍然不能满足用户的需求。目前已有的搜索引擎大部分是基于关键词或者基于文本内容的检索,并不能充分表达语义信息。语义搜索技术可改善当前搜索引擎的搜索效果,包括查全率和查准率,作为未来语义Web的最主要应用之一,语义搜索将对人们的生活产生重大的影响。
融合本体技术可实现一定程度上的语义搜索,但基于经典描述逻辑的本体知识库却带来了新的问题,即无法对模糊信息进行描述和推理。虽然描述逻辑描述能力很强,本体应用也十分广泛,但描述逻辑无法处理模糊信息中的模糊概念,如“精彩”、“年轻”等。因此对描述逻辑进行模糊扩展,实现基于模糊领域本体的模糊语义搜索具有很强的实用意义。
另外,传统的信息检索(IR)技术大多数基于文档中关键词出现的次数。虽然XML检索系统也考虑到将结构查询与内容检索的结合,但其数据模型结构相对语义网要简单,已有方法不能完全满足语义网检索。当前越来越多的Web信息资源进行了语义标注,并以符合RDF(Resource DescriptionFramework,资源描述框架)或XML(EXtensible Markup Language,可扩展置标语言)语法的语义网语言进行描述。面对大量的语义网信息,如何提供比传统信息检索更有效的访问和更合理的检索结果成为语义搜索所面临的重要问题之一。
目前绝大部分基于描述逻辑的系统都是采用经典描述逻辑,包括其知识表示以及知识推理。随着OWL(本体描述语言)的推广,目前大部分本体系统也都采用经典描述逻辑作为其基础的逻辑支撑。然而正如上文所言,经典描述逻辑面对模糊信息具有难以克服的缺陷,因此对描述逻辑的模糊扩展也渐渐成为研究热点。然而,模糊描述逻辑也仅仅停留在研究阶段,还从未得以实施。此外,针对描述逻辑模糊扩展的研究还仅仅限于描述逻辑的1-型模糊扩展,即使用确定的隶属度值来描述模糊性,并不能很好的应用于现实应用。
在实现本发明的过程中,发明人发现:
现有搜索引擎在查全、查准率上仍有较大的提升空间,同时,基于关键词的传统查询无法实现复杂的约束查询,且无法实现资源间的复杂关系查询,导致用户语义搜索的查全率低。
发明内容
本发明实施例提供了一种模糊语义搜索方法、系统及设备,以提高用户语义搜索的查全率。
本发明实施例提供了一种模糊语义搜索方法,包括以下步骤:
对用户输入的代表模糊概念的关键词以及代表语气算子的关键词,利用所述模糊本体知识库进行推理计算,并将推理计算产生的关键词组合作为扩展后的查询条件;
根据所述扩展后的查询条件,在所述资源索引库中检索出符合条件的查询结果。
本发明实施例提供了一种模糊语义搜索系统,包括语义搜索节点、至少一个资源网站及内部网络,所述语义搜索节点具体包括:
本体知识库节点,用于存储模糊领域本体,所述领域本体用OWL文件实现;
爬行器节点,用于负责集中式爬行内部网资源,获取资源内容并建立索引,维护URL信息及设置爬行范围;
搜索节点,用于用户自行选择查询方式;
推理节点,用于推理实现语义搜索推理服务,并返回推理结果提交给传统搜索引擎或者直接返回给用户。
本发明实施例提供了一种语义搜索节点,包括:
本体知识库节点,用于存储模糊领域本体,所述领域本体用本体描述语言OWL文件实现;
爬行器节点,用于负责集中式爬行内部网资源,获取资源内容并建立索引,维护通用资源定位符URL信息及设置爬行范围;
搜索节点,用于用户自行选择查询方式;
推理节点,用于推理实现语义搜索推理服务,并返回推理结果提交给传统搜索引擎或者直接返回给用户。
本发明实施例中,通过基于本体的关键词解析,可将关键词扩展为其相等概念、子概念等,并能够在一定程度上处理模糊关键词,从而提高了查全率。
附图说明
图1是本发明实施例中语义搜索系统结构图;
图2是本发明实施例中爬行流程示意图;
图3是本发明实施例中模糊语义搜索方法流程图;
图4是本发明实施例中推理方法流程图;
图5是本发明实施例中图形化定制语义查询过程流程图;
图6a是本发明实施例中概念检索结果生成页面示意图;
图6b是本发明实施例中模糊概念检索结果生成页面示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;华中科技大学,未经华为技术有限公司;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810093969.2/2.html,转载请声明来源钻瓜专利网。





