[发明专利]一种问答库的扩充方法、装置及服务器、存储介质在审
申请号: | 201910675047.0 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110413755A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答库 存储介质 可信度 聚类 服务器 人工智能领域 数据扩充 问答系统 准确度 机器人 存储 答案 应用 | ||
1.一种问答库的扩充方法,其特征在于,所述方法包括:
对所述问答库中的各个问题进行聚类,并将聚类为同一类的问题与所述同一类的问题各自对应的答案进行组合,得到至少一个第一问答对;
获取所述至少一个第一问答对中各个第一问答对的可信度,并根据所述各个第一问答对的可信度从所述至少一个第一问答对中确定出第一目标问答对;
将所述第一目标问答对存储至所述问答库。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述问答库中获取第一问题,并调用第一序列生成模型确定所述第一问题对应的至少一个文本序列,以及所述至少一个文本序列中各个文本序列的置信度,所述第一问题为所述问答库中存储的至少一个问题中的任一个;
将所述第一问题对应的至少一个文本序列中置信度大于或者等于第一置信度阈值的文本序列确定为所述第一问题对应的新增答案;
生成由所述第一问题和所述新增答案组成的新问答对,并将由所述第一问题和所述新增答案组成的新问答对存储至所述问答库。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
对所述问答库中的各个答案进行聚类,并将聚类为同一类的答案与所述同一类的答案各自对应的问题进行组合,得到至少一个第二问答对;
获取所述至少一个第二问答对中各个第二问答对的可信度,并根据所述各个第二问答对的可信度从所述至少一个第二问答对中确定出第二目标问答对;
将所述第二目标问答对存储至所述问答库。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
从所述问答库中获取第一答案,并调用第二序列生成模型确定所述第一答案对应的至少一个文本序列,以及所述第一答案对应的至少一个文本序列中各个文本序列的置信度,所述第一答案为所述问答库中存储的至少一个答案中的任一个;
将所述第一答案对应的至少一个文本序列中置信度大于或者等于第一置信度阈值的文本序列确定为所述第一答案对应的新增问题;
生成由所述第一答案和所述新增问题组成的新问答对,并将由所述第一答案和所述新增问题组成的新问答对存储至所述问答库。
5.根据权利要求1所述的方法,其特征在于,所述对所述问答库中的各个问题进行聚类,包括:
调用聚类模型计算所述问答库中各个问题之间的相似度;
将所述相似度大于或者等于预设相似度阈值的问题聚类为同一类的问题。
6.根据权利要求1所述的方法,其特征在于,所述根据所述各个第一问答对的可信度从所述至少一个第一问答对中确定出第一目标问答对,包括:
从所述至少一个第一问答对中选取出可信度大于或者等于预设可信度阈值的候选问答对;
若所述预设可信度阈值满足预设可信度阈值条件,则将所述候选问答对确定为第一目标问答对;
若所述预设可信度阈值不满足预设可信度阈值条件,则输出所述候选问答对,并基于针对所述候选问答对的选取操作从所述候选问答对中确定出第一目标问答对。
7.根据权利要求1所述的方法,其特征在于,所述获取所述至少一个第一问答对中各个第一问答对的可信度,包括:
调用分类模型提取所述各个第一问答对中问题和答案各自对应的特征信息,并计算所述各个第一问答对中问题和答案各自对应的特征信息之间的特征相似度;
基于所述各个第一问答对中问题和答案各自对应的特征信息之间的特征相似度,确定所述各个第一问答对的可信度。
8.一种问答库的扩充装置,其特征在于,所述装置包括:
聚类模块,用于对所述问答库中的各个问题进行聚类,并将聚类为同一类的问题与所述同一类的问题各自对应的答案进行组合,得到至少一个第一问答对;
处理模块,用于获取所述至少一个第一问答对中各个第一问答对的可信度,并根据所述各个第一问答对的可信度从所述至少一个第一问答对中确定出第一目标问答对;
存储模块,用于将所述第一目标问答对存储至所述问答库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910675047.0/1.html,转载请声明来源钻瓜专利网。