[发明专利]基于多维语义的可视化网络检索呈现系统及呈现控制方法有效
申请号: | 201210473410.9 | 申请日: | 2012-11-20 |
公开(公告)号: | CN102915381A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 李逸;胡传平;梁辰;梅林;齐力 | 申请(专利权)人: | 公安部第三研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 王洁;郑暄 |
地址: | 200031*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 语义 可视化 网络 检索 呈现 系统 控制 方法 | ||
技术领域
本发明涉及网络检索技术领域,具体网络检索呈现技术领域,具体是指一种基于多维语义的可视化网络检索呈现系统及呈现控制方法。
背景技术
随着检索技术的飞速发展,国内外涌现出如谷歌(Google)、雅虎(Yahoo)、百度(Baidu)等各类成熟的搜索引擎。这些搜索引擎主要基于文本的信息检索技术,为用户提供完备性强、相关性高的信息检索引擎。虽然现有的文本搜索技术能搜索到包含用户的文本查询信息的文件,但是呈现形式主要是按照搜索结果的相关度进行排序,并将结果按照相关程度的大小,以链接结果集的形式返回给用户。这种检索技术最大的缺点是,检索关键词的多义性导致搜索结果集的语义关系千差万别,比如,当用户提交给搜索引擎的搜索关键词为“苹果”时,搜索引擎无法正确判断“苹果”是指水果“苹果”,还是由Steve Jobs创办的“苹果”公司,或者是指法国电影“The Apple”。搜索引擎在毫无上下文相关的情况下,无法准确确定出搜索的“苹果”关键词与哪一种候选内容最相关,所以导致搜索到的结果往往不能满足用户的需求。
发明内容
本发明的目的是克服了上述现有技术中的缺点,提供一种通过匹配用户的文本查询信息和文件的索引信息,将检索结果按照语义的逻辑性分层次分维度地呈现给用户,以利于在用户在基于多维度的候选检索结果呈现形式中,快速地定位到检索的目标结果,从而有效区分同一文本的不同语义,提高检索效率,且系统结构简单,成本低廉,方法应用方式简便,应用范围广泛的基于多维语义的可视化网络检索呈现系统及呈现控制方法。
为了实现上述的目的,本发明的基于多维语义的可视化网络检索呈现系统具有如下构成:
该系统包括查询服务器、语义匹配与推理模块、索引数据库、语义索引结果集、分维规则单元和多维结果呈现单元。其中,查询服务器用以提供用户搜索关键词输入接口;语义匹配与推理模块连接所述的查询服务器,根据相关领域内的知识集合对关键词语义进行匹配和推理;索引数据库分别连接所述的查询服务器和语义匹配与推理模块,用以为搜索关键词提供对应的搜索结果;语义索引结果集连接所述的索引数据库,用以保存与搜索关键词对应的索引结果集;分维规则单元分别连接所述的语义索引结果集和语义匹配与推理模块,根据语义索引结果集中关键词的语义距离,将索引结果集聚类成多个维度上的多个层次数据结果;多维结果呈现单元则连接所述的分维规则单元,用以向用户呈现所述的多个维度上的多个层次数据结果。
该基于多维语义的可视化网络检索呈现系统中,所述的语义匹配与推理模块包括标准本体知识库、语义匹配单元和语义推理单元。其中,标准本体知识库存储有相应领域内的本体知识集合;语义匹配单元连接所述的标准本体知识库,根据所述的本体知识集合获得关键词的语义匹配规则,并进行语义匹配;语义推理单元连接所述的标准本体知识库,根据所述的本体知识集合获得关键词的语义推理规则,并进行语义推理。
本发明还提供一种利用所述的系统基于多维语义实现可视化网络检索呈现控制的方法,该方法包括以下步骤:
(1)所述的查询服务器接收到查询关键词,并判断关键词是否是复杂句,若是,则进入步骤(2),若否,则进入步骤(3);
(2)所述的查询服务器进行分词过滤处理,并向所述的索引数据库输出包含分隔号的关键词字符串,然后进入步骤(3);
(3)所述的语义匹配与推理模块对所述的关键词进行语义匹配和推理,并将语义推理结果集发送到所述的索引数据库;
(4)所述的索引数据库根据获取的语义匹配和推理结果集建立并保存语义本体索引,并将语义匹配和推理结果集的索引结果集发送至所述的分维规则单元;
(5)多维规则单元根据所述的语义索引结果集中关键词的语义距离,将索引结果集聚类成具有多个维度的数据形式,所述的数据形式在各个维度上聚类多个层次的数据结果;
(6)多维结果呈现单元向用户呈现多个维度上的多个层次数据结果。
该基于多维语义实现可视化网络检索呈现控制的方法中,所述的查询服务器进行分词过滤处理,并向所述的索引数据库输出包含分隔号的关键词字符串,具体为:所述的查询服务器根据关键词的不同语言类型分别进行分词和过滤处理,并输出包含分隔号的关键词字符串。
该基于多维语义实现可视化网络检索呈现控制的方法中,所述的语义匹配与推理模块包括标准本体知识库、语义匹配单元和语义推理单元,所述的标准本体知识库存储有相应领域内的本体知识集合;所述的语义匹配单元和所述的语义推理单元均连接所述的标准本体知识库,所述的步骤(3)具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部第三研究所,未经公安部第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210473410.9/2.html,转载请声明来源钻瓜专利网。