[发明专利]一种检索请求语义扩展方法在审
申请号: | 201911344526.0 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111126074A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 陈泽峰;鬲玲;章翔峰;张明;单卓鑫 | 申请(专利权)人: | 北京神舟航天软件技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/33;G06F16/36 |
代理公司: | 北京世誉鑫诚专利代理事务所(普通合伙) 11368 | 代理人: | 孙国栋 |
地址: | 100094*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检索 请求 语义 扩展 方法 | ||
本发明实施例提供的检索请求语义扩展方法,涉及信息检索技术领域,通过接收用户发送的检索请求并对检索请求进行预处理,生成关键词列表;判断关键词列表是否为词表模型中的词汇,若是,则根据检索请求,判断用户的检索意图;根据检索意图,为关键词列表匹配对应的扩展策略;根据扩展策略,对关键词列表进行语义扩展,生成第一扩展词集;分别计算第一扩展词集中的各个扩展词与所述关键词列表中的各个关键词的语义相关度,滤除语义相关度度小于设定阈值的扩展词,生成第二扩展词集,能够准确地获取词汇关系,实现了有效地对用户的领域性检索请求进行扩展,不依赖词典对用户的检索请求进行扩展,提高了扩展的效率及精确度。
技术领域
本发明涉及信息检索技术领域,具体涉及一种检索请求语义扩展方法。
背景技术
为了在海量的网络数据中进行有效地查找信息,搜索引擎成为了必要查找工具。如何提高引擎的检索精度是近年来备受关注的技术热点。传统的关键词匹配方式已经满足不了用户的检索需求,这种精确匹配的方式在以下的应用场景中存在很大的缺陷:用户无法精确描述检索需求、相同的检索意图可以有多种不同的描述方式。
为了能尽可能地满足用户的检索期望,为用户返回更加精准的检索结果,对用户的检索请求进行扩展成为一种解决以上问题的有效方式。目前在词汇扩展方面已存在一些比较成熟的技术方案,如由普林斯顿大学整理完成的一种基于认知语言学的英文词汇语义网“WordNet”、微软的“MindNet”、以WordNet为框架研制的现代汉语概念词典“中文概念辞书”和以汉语、英语的词语所代表的概念为描述对象、以揭示概念与概念之间以及概念所具有的实属性之间的关系为基本内容的常识知识库“HowNet”,这些词典都可以作为词汇语义扩展的依据和基础。此外,还有基于统计的词汇扩展方法,即通过分析语料中的词汇共现来确定词汇的扩展结果。
现有的语义扩展方法存在以下不缺陷:
(1)词典的维护成本较高,当有新词出现而没有加入到语义网络中时,无法准确地获取词汇关系,导致无法有效地对用户的检索请求进行扩展;
(2)结合用户的组织、角色等信息,用户的检索请求往往具有领域性,而涵盖各方面信息的词典对于具有领域性的用户而言存在严重的信息冗余问题,导致扩展效率及精确度较低;
(3)词典的组织方式无法按类别归类词汇,使得词汇的扩展在语义上过于发散,无法聚焦到某个或某些领域。
发明内容
为解决现有技术的不足,本发明实施例提供了一种检索请求语义扩展方法,该检索请求语义扩展方法包括以下步骤:
接收用户发送的检索请求并对所述检索请求进行预处理,生成关键词列表;
判断所述关键词列表是否为词表模型中的词汇,若是,则根据所述检索请求,判断用户的检索意图;
根据所述检索意图,为所述关键词列表匹配对应的扩展策略;
根据所述扩展策略,对所述关键词列表进行语义扩展,生成第一扩展词集;
分别计算所述第一扩展词集中的各个扩展词与所述关键词列表中的各个关键词的语义相关度,滤除语义相关度度小于设定阈值的扩展词,生成第二扩展词集。
优选地,根据所述检索请求,判断用户的检索意图包括:
判断所述关键词列表中是否存在动态参数,若是,则根据所述动态参数,判断用户的检索意图,得到用户的第一检索意图y1;
若否,则根据所述关键词列表中词汇之间的关联关系,判断用户的检索意图,得到用户的第二检索意图y2;
根据第一检索意图y1及第二检索意图y2,确定最终的用户检索意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神舟航天软件技术有限公司,未经北京神舟航天软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911344526.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种苏打盐碱地改良剂及改良方法
- 下一篇:战斗策略生成方法及装置