[发明专利]搜索引擎询问自动补全的方法、系统、存储介质及设备有效
| 申请号: | 202110102008.9 | 申请日: | 2021-01-26 |
| 公开(公告)号: | CN112800314B | 公开(公告)日: | 2023-06-02 |
| 发明(设计)人: | 孙晓飞;孟昱先 | 申请(专利权)人: | 浙江香侬慧语科技有限责任公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/9538 |
| 代理公司: | 北京国科程知识产权代理事务所(普通合伙) 11862 | 代理人: | 曹晓斐 |
| 地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索引擎 询问 自动 方法 系统 存储 介质 设备 | ||
1.一种搜索引擎询问自动补全的方法,其特征在于,包括:
数据库向量匹配步骤,分别获取部分询问的第一句向量和数据库中完整句子的第二句向量,计算输入的所述部分询问与数据库中所述完整句子的相似度,根据所述相似度大小,在所述完整句子中选取多个相似句子,并获取所述多个相似句子各自对应的相似度得分;
语言模型得分计算步骤,通过语言模型分别计算所述多个相似句子与所述部分询问的真实性得分,根据所述相似度得分和所述真实性得分分别计算所述多个相似句子与所述部分询问的最终得分;
结果反馈步骤,对所述最终得分从高到低进行排序,根据排序结果在所述多个相似句子中选取一定数量的相似句子作为最终结果进行反馈,其中
通过所述语言模型对各个所述相似句子对应的组成词进行分析,获得各个所述组成词的真实性概率,其中所述真实性概率为各个所述组成词在对应的所述相似句子中出现的概率;以及
根据各个所述组成词的所述真实性概率计算各个所述组成词对应的所述相似句子的真实性得分,其中
所述通过所述语言模型对各个所述相似句子对应的组成词进行分析,获得各个所述组成词的真实性概率的过程包括:
若当前组成词为对应的所述相似句子中的第一个词,则所述当前组成词对应的所述真实性概率为所述当前组成词在所述语言模型中单独出现的概率;以及
若当前组成词为对应的所述相似句子中除第一个词以外的其他词,则所述当前组成词对应的所述真实性概率为在所述语言模型中,所述当前组成词之前的所有词出现后,所述当前组成词出现的概率。
2.如权利要求1所述的搜索引擎询问自动补全的方法,其特征在于,所述数据库向量匹配步骤进一步包括:
对所述第一句向量与每个所述第二句向量进行相似度计算,得到所述部分询问与数据库中完整句子的相似度。
3.如权利要求1所述的搜索引擎询问自动补全的方法,其特征在于,所述根据所述相似度大小,在所述完整句子选取多个相似句子的过程,进一步包括:
将所述相似度大小在预设阈值范围内的所述完整句子作为所述相似句子。
4.如权利要求1所述的搜索引擎询问自动补全的方法,其特征在于,预先计算所述数据库中的每个完整句子的句向量,并保存在所述数据库中。
5.如权利要求1所述的搜索引擎询问自动补全的方法,其特征在于,所述根据排序结果选择一定数量的相似句子作为最终结果进行反馈的过程,包括:
所述一定数量不大于所述搜索引擎的下拉框所能包含句子的最大数量。
6.一种搜索引擎询问自动补全系统,其特征在于,包括:
数据库向量匹配模块,用于计算输入的部分询问与数据库中完整句子的相似度,根据所述相似度大小,在所述完整句子选取多个相似句子,并获取所述多个相似句子对应的相似度得分;
语言模型得分计算模块,用于通过语言模型分别计算所述多个相似句子与所述部分询问的真实性得分,根据所述相似度得分和所述真实性得分分别计算所述多个相似句子与所述部分询问的最终得分;
结果反馈模块,用于对所述最终得分从高到低进行排序,根据排序结果选择一定数量的相似句子作为最终结果进行反馈,其中
所述通过所述语言模型对各个所述相似句子对应的组成词进行分析,获得各个所述组成词的真实性概率的过程包括:
若当前组成词为对应的所述相似句子中的第一个词,则所述当前组成词对应的所述真实性概率为所述当前组成词在所述语言模型中单独出现的概率;以及
若当前组成词为对应的所述相似句子中除第一个词以外的其他词,则所述当前组成词对应的所述真实性概率为在所述语言模型中,所述当前组成词之前的所有词出现后,所述当前组成词出现的概率。
7.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-5中任一项所述的搜索引擎询问自动补全的方法。
8.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中所述处理器操作所述计算机指令以执行权利要求1-5中任一项所述的搜索引擎询问自动补全的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江香侬慧语科技有限责任公司,未经浙江香侬慧语科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110102008.9/1.html,转载请声明来源钻瓜专利网。





