[发明专利]一种基于主动学习的问答方法、系统、设备及介质在审
| 申请号: | 202111541745.5 | 申请日: | 2021-12-16 |
| 公开(公告)号: | CN114385798A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 冯耀;王椭;朱祥;熊赏;陈娜;陆恒宇;罗浩昇;赵权有 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06K9/62;G06N5/02 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
| 地址: | 200002 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 主动 学习 问答 方法 系统 设备 介质 | ||
本发明涉及一种基于主动学习的问答方法、系统、设备及介质,所述方法包括以下步骤:构建基础知识库;基于相似度检测模型进行客户问答并构建未解答问题集,所述的未解答问题集包括用户反馈为问题未解答的用户问题;对未解答问题集中的问题进行类别划分;获取专家修正信息,基于专家修正信息对对划分好类别的未解答问题集进行类别修正;基于类别修正结果对相似度检测模型进行优化训练;获取未解答问题集中每一个类别的对应回答,将问题和对应回答更新到基础知识库中。与现有技术相比,本发明具有问答更精确,降低人工成本,提高标注效率等优点。
技术领域
本发明涉及智能问答领域,尤其是涉及一种基于主动学习的问答方法、系统、设备及介质。
背景技术
可以实现与用户的闲聊,随着企业对客户服务的重视,聊天机器人从娱乐领域逐渐向客户服务等领域发展。
由于聊天机器人无法自行回答技术问题,现在通常的做法是收集许多由“问题-答案”组成的问答对,构建知识库来提供支持。当用户提问时,聊天机器人在知识库中搜索最为相关的问题,提取答案进行回复。
知识库的完善程度决定了用户的体验,无论搜索技术与相似匹配技术多么完善,如果相关的问题在知识库中没有存储,聊天机器人就无法回答用户的问题。为了完善知识库,可以会定期收集问答系统无法回答的问题,交由专家标注,向知识库中补充相应问答对。但由于专家的人力有限,未解答的问题的数量级又比较大,专家不仅难以及时标注所有问题,也无法从众多候选中找到高频的问题进行优先标注。当多个专家同时标注时,还可能因为相似问题产生重复标注,浪费人力。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于主动学习的问答方法、系统、设备及介质。
本发明的目的可以通过以下技术方案来实现:
一种基于主动学习的问答方法,包括以下步骤:
S1:构建基础知识库,所述基础知识库内包括已知问题和已知问题对应的回答;
S2:基于相似度检测模型进行客户问答并构建未解答问题集,所述的未解答问题集包括用户反馈为问题未解答的用户问题;
S3:对未解答问题集中的问题进行类别划分;
S4:获取专家修正信息,基于专家修正信息对对划分好类别的未解答问题集进行类别修正;
S5:基于类别修正结果对相似度检测模型进行优化训练;
S6:获取未解答问题集中每一个类别的对应回答,将问题和对应回答更新到基础知识库中。
优选地,所述的步骤S2具体包括:
S21:建立文本相似度检测模型;
S22:获取用户待答问题并在基础知识库中通过文本相似度检测模型搜索相似度最高的已知问题的回答作为回答输出;
S23:构建未解答问题集,获取用户反馈,若用户反馈为问题未解答,则将对应问题存入未解答问题集中。
优选地,所述的步骤S3具体包括:
S31:在未解答问题集中选取第一问题作为第一类别的基准问题;
S32:在未解答问题集中选取待分类问题与所有类别的基准问题逐个进行相似度计算,若所有类别中存在类别的基准问题与待分类问题的相似度大于相似度阈值,则将待分类问题判定为该类别,否则将待分类问题作为新的类别的基准问题;
S33:重复步骤S32直到未解答问题集所有的问题都完成类别划分。
所述的步骤S3还包括:步骤S34:按每个类别中问题的数量对类别进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111541745.5/2.html,转载请声明来源钻瓜专利网。





