[发明专利]一种基于词性扩展的搜索优化方法及系统在审
| 申请号: | 202010798255.2 | 申请日: | 2020-08-10 |
| 公开(公告)号: | CN111931026A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 张磊;吴红;欧阳潘义;张宸 | 申请(专利权)人: | 湖南快乐阳光互动娱乐传媒有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/31;G06F16/33 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 钱娜 |
| 地址: | 410003 湖南省*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 词性 扩展 搜索 优化 方法 系统 | ||
本发明公开了一种基于词性扩展的搜索优化方法及系统,方法包括:基于文本词性的不同维度生成基础数据,基于预设规则对基础数据进行扩展,生成扩展数据,将基础数据和扩展数据汇总成数据词典,基于数据词典制定意图匹配规则;接收用户输入的原始输入词,基于意图匹配规则对原始输入词进行处理,得到处理结果;基于处理结果进行检索和排序,输出搜索结果。本发明能够提高搜索的召回率和匹配结果的相似度,得到更优的搜索结果。
技术领域
本发明涉及信息搜索技术领域,尤其涉及一种基于词性扩展的搜索优化方法及系统。
背景技术
传统的搜索引擎使用分词工具对用户的输入进行切分成单词,然后查找倒排索引,从中读取包含单词的文档,再利用单词频率信息、文档频率信息即可以对这些候选搜索结果进行排序,计算相似性进行排序,最后为用户展示搜索结果。这种做法有一定局限性,当用户的输入词不被能意图识别准确判断,会造成搜索结果的相似度大大降低,无法匹配出相似度高的结果。
因此,如何提高搜索的召回率和匹配结果的相似度,得到更优的搜索结果,是一项亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于词性扩展的搜索优化方法,能够提高搜索的召回率和匹配结果的相似度,得到更优的搜索结果。
本发明提供了一种基于词性扩展的搜索优化方法,包括:
基于文本词性的不同维度生成基础数据;
基于预设规则对所述基础数据进行扩展,生成扩展数据;
将所述基础数据和所述扩展数据汇总成数据词典;
基于所述数据词典制定意图匹配规则;
接收用户输入的原始输入词,基于所述意图匹配规则对所述原始输入词进行处理,得到处理结果;
基于所述处理结果进行检索和排序,输出搜索结果。
优选地,所述基于文本词性的不同维度生成基础数据至少包括以下其中一种实现方式:
基于搜索视频的内容,得到基础数据;
基于搜索视频的相关人名,得到基础数据;
基于搜索视频的类型,得到基础数据;
基于搜索视频的相关性和运营,得到基础数据。
优选地,所述基于预设规则对所述基础数据进行扩展,生成扩展数据至少包括以下其中一种实现方式:
使用明星与分类进行合并对所述基础数据进行扩展,生成扩展数据;
使用系列名称与明星进行合并对所述基础数据进行扩展,生成扩展数据;
使用合集标题与明星进行合并对所述基础数据进行扩展,生成扩展数据;
使用明星名称与明星名称进行合并对所述基础数据进行扩展,生成扩展数据;
使用标签与分类进行合并对所述基础数据进行扩展,生成扩展数据;
使用时间、标签和分类进行合并对所述基础数据进行扩展,生成扩展数据。
优选地,所述接收用户输入的原始输入词,基于所述意图匹配规则对所述原始输入词进行处理,得到处理结果,包括:
接收用户输入的原始输入词,基于所述意图匹配规则对所述原始输入词进行匹配对比,提取出特征关键词,并对提取出的特征关键词进行标注,将标注后的特征关键词作为处理结果。
一种基于词性扩展的搜索优化系统,包括:
基础数据生成模块,用于基于文本词性的不同维度生成基础数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010798255.2/2.html,转载请声明来源钻瓜专利网。





