[发明专利]一种输入语料的推荐方法和装置在审
| 申请号: | 202110576949.6 | 申请日: | 2021-05-26 |
| 公开(公告)号: | CN113325959A | 公开(公告)日: | 2021-08-31 |
| 发明(设计)人: | 朱彬 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F16/332 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 王志远;王安娜 |
| 地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 输入 语料 推荐 方法 装置 | ||
1.一种输入语料的推荐方法,其特征在于,包括:
接收用户输入;
基于所述用户输入、本地词库对应的索引号生成词组标识,以判断本地词库中是否存在与所述用户输入匹配的词组:
若存在,则根据所述词组从本地语料库中获取一条或多条语料以推荐给所述用户;
若不存在,则将所述用户输入发送至搜索引擎,以从所述搜索引擎中获取一条或多条语料以推荐给所述用户。
2.根据权利要求1所述的输入语料的推荐方法,其特征在于,所述根据所述词组从本地语料库中获取一条或多条语料以推荐给所述用户,包括:
从所述本地语料库中获取与所述词组对应的一条或多条语料,以及所述语料对应的一个或多个预设权重参数;
获取所述用户输入对应的一个或多个业务参数;
在所述业务参数属于所述语料对应的预设权重参数的情况下,根据所述业务参数对应的权重,计算所述语料对应的权重分数;
根据所述语料对应的权重分数由高到低的顺序选取一个或多个语料以推荐给所述用户。
3.根据权利要求1所述的输入语料的推荐方法,其特征在于,还包括:
在判断本地词库中是否存在与所述用户输入匹配的词组之前,从所述用户输入中删除下述一种或多种内容:停用词、标点符号、特殊字符、表情。
4.根据权利要求1所述的输入语料的推荐方法,其特征在于,还包括:
在判断本地词库中是否存在与所述用户输入匹配的词组之前,判断所述本地词库对应的版本是否为最新版本,以在所述本地词库对应的版本不是最新版本的情况下,从所述搜索引擎中获取最新版本的词库。
5.根据权利要求1所述的输入语料的推荐方法,其特征在于,还包括:
在判断本地词库中是否存在与所述用户输入匹配的词组之前,判断所述本地词库是否可用:若可用,则继续判断本地词库中是否存在与所述用户输入匹配的词组;若不可用,则将所述用户输入发送至所述搜索引擎。
6.根据权利要求5所述的输入语料的推荐方法,其特征在于,
在出现下述任意一种情况时将所述本地词库设置为不可用:所述用户为黑名单用户、当前时间段为预设的不可用时间段、所述本地词库对应的响应时间大于阈值响应时间、所接收的用户输入数量大于阈值用户输入数量。
7.根据权利要求6所述的输入语料的推荐方法,其特征在于,
通过埋点技术收集所述用户输入、推荐给所述用户与所述用户输入对应的一条或多条语料、所述用户点击的语料,以更新所述本地词库、所述本地语料库。
8.根据权利要求7所述的输入语料的推荐方法,其特征在于,
基于一个或多个可插拔的组件将所述本地词库设置为不可用;
基于可插拔的业务埋点组件收集所述用户输入、推荐给所述用户与所述用户输入对应的一条或多条语料、所述用户点击的语料。
9.一种输入语料的推荐装置,其特征在于,包括:用户输入接收模块、语料获取模块;其中,
所述用户输入接收模块,用于接收用户输入;
所述语料获取模块,用于基于所述用户输入、本地词库对应的索引号生成词组标识,以判断本地词库中是否存在与所述用户输入匹配的词组:
若存在,则根据所述词组从本地语料库中获取一条或多条语料以推荐给所述用户;
若不存在,则将所述用户输入发送至搜索引擎,以从所述搜索引擎中获取一条或多条语料以推荐给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110576949.6/1.html,转载请声明来源钻瓜专利网。





