[发明专利]基于词表模型的用户检索意图判断方法有效
| 申请号: | 201811634847.X | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN109670102B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 敬石开;鬲玲;陈泽峰 | 申请(专利权)人: | 北京神舟航天软件技术有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F40/30;G06F40/289 |
| 代理公司: | 北京世誉鑫诚专利代理有限公司 11368 | 代理人: | 孙国栋 |
| 地址: | 100094*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 词表 模型 用户 检索 意图 判断 方法 | ||
本发明公开了一种基于词表模型的用户检索意图判断方法,主要步骤包括:101、构建词表模型;102、获取用户检索请求;103、判断相邻词汇在词表模型中的结构关系;104、利用结构关系的相关侧面、关系类型信息,判断用户意图;105、对于每一个关键词,被重复判断意图的词汇进行意图合并;106、形成用户意图量化表达。本发明通过利用已构建的词表模型中的结构关系,挖掘用户输入多关键词检索时所包含的检索意图,既考虑了用户检索输入结构,又考虑了词汇之间的语义关联。该发明中基于词表模型的用户检索意图判断在不依赖于搜索结果的情况下为搜索引擎提供了更多的信息支持,使得检索结果更加符合用户的期望。
技术领域
本发明属于信息检索领域,涉及一种用户检索意图判断方法,具体涉及基于词表模型的用户检索意图判断方法。
背景技术
搜索引擎的应用,使得用户能够在海量网络数据中更加有效地进行知识查找。用户在使用搜索引擎时,一般是自己组织检索输入关键词进行信息搜索。大多数情况下,用户的输入的并不是杂乱无章的关键词,而是按照一定的语义关联进行检索。因此,用户的检索输入实际上包含了用户的部分检索意图,在进行信息检索时,搜索引擎应该充分利用这部分意图。
目前常用的用户检索意图判断方法主要有两种:用户输入关键词的语义分析和用户对检索结果的反馈行为。
对用户输入关键词的语义分析,是将用户输入关键词拆分为独立的语义单词,形成关键词列表后通过匹配搜索引擎索引库中的词语实现对检索结果的匹配。这种分析方法的不足之处在于:直接忽略了检索输入间的语义关联,并且只能通过输入关键词与索引库的匹配进行检索意图判断。
用户对检索结果的反馈行为主要包括用户对检索结果的点击、浏览、收藏等行为,根据用户的行为分析用户兴趣喜好,并对检索结果进行调整。这种基于用户行为的分析方法不足之处在于:首先,引擎需要对用户行为进行实时分析,提高了对引擎的要求;其次,需要记录用户的各种行为反馈,进而需要通过反馈分析用户的实际需求;再次,在检索过程中,用户的点击行为是不可控的、多变的,其行为有效性不易保证,容易引入噪声信息;最后,基于用户对结果反馈的意图判断属于事后处理方式,影响直接展示效果。
鉴于以上所述现有技术存在的问题和不足,本发明提出一种基于词表模型的用户检索意图判断方法。此方法基于已经构建好的词表模型,对用户输入的关键词进行分析,确认关键词之间的结构关系,关系类型等。基于此分析结果,对用户的检索意图进行扩展。
发明内容
发明目的:本发明针对上述现有技术存在的问题做出改进,即本发明公开了一种基于词表模型的用户检索意图判断方法,该方法适用于利用已构建的词表模型中的结构关系,挖掘用户输入多关键词检索时所包含的检索意图。既考虑了用户检索输入结构,又考虑了词汇之间的语义关联。该发明中基于词表模型的用户检索意图判断在不依赖于搜索结果的情况下为搜索引擎提供了更多的信息支持,使得检索结果更加符合用户的期望。
本发明通过分析用户输入的关键词之间的语义关系,对用户检索意图进行分析,将用户输入的关键词扩展为多个关键词,一起作为输入返回检索结果。
技术方案:基于词表模型的用户检索意图判断方法,包括以下步骤:
101、构建词表模型,完成后进入步骤102;
102、获取用户检索请求,完成后进入步骤103;
103、判断相邻词汇在词表模型中的结构关系,完成后进入步骤104;
104、利用结构关系信息,判断用户意图,完成后进入步骤105;
105、对于每一个关键词,被重复判断意图的词汇进行意图合并,完成后进入步骤106;
106、形成用户意图量化表达。
进一步地,步骤101包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神舟航天软件技术有限公司,未经北京神舟航天软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811634847.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:爬虫调度方法、装置、电子设备及存储介质
- 下一篇:数据抓取方法及装置





