[发明专利]一种基于混合模型的问答机器人系统及问答机器人在审
| 申请号: | 201911260339.4 | 申请日: | 2019-12-10 |
| 公开(公告)号: | CN111190998A | 公开(公告)日: | 2020-05-22 |
| 发明(设计)人: | 陈海飞 | 申请(专利权)人: | 上海八斗智能技术有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/289;G06F40/30;G06K9/62;G06N3/04 |
| 代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 夏允峰 |
| 地址: | 200082 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 混合 模型 问答 机器人 系统 | ||
本发明提供了一种基于混合模型的问答机器人系统和问答机器人,其中基于混合模型的问答机器人系统,包括:获取模块,获取模块用于获取用户问句q;预处理模块,预处理模块用于对用户问句q进行预处理;混合模型,混合模型包括词对齐模型和句子向量模型;模型融合模块,模型融合模块用于将词对齐模型和句子向量模型融合,获取用户问句q属于每个类别i的概率;输出模块,输出模块用于输出用户问句q对应的概率最高的类别i对应的答案。本基于混合模型的问答机器人系统及问答机器人,能够提高模型的泛化能力和答案的准确性。
技术领域
本发明涉及问答机器人技术领域,尤其涉及一种基于混合模型的问答机 器人系统及问答机器人。
背景技术
随着互联网技术的不断普及,用户越来越多地使用服务提供商所提供的 互联网平台来向客服人员咨询比如服务质量、服务维护之类的问题。为了提 高客服效果和节约人力成本,服务提供商通常使用比如客服机器人的问答机 器人系统来与用户进行交流沟通并给予答复。例如,客服机器人首先使用具 有标准问题/标准问题对和问题/答案对的知识数据库以及历史问题/答案实例 来训练问答模型。接着,针对用户所输入的问法,使用所训练的问答模型来 给出问题答案。客服机器人的客服效率直接影响服务提供商的客服系统的服 务能力以及用户的客服体验。
现有的客服类问答机器人大多采用关键词匹配的技术:先提取用户问句 中的关键词,然后利用关键词在知识库中搜索类似的问题,进而给出答案。 为了适应各种问法和关键词组合,关键词模型还衍生出关键词模板等功能。
以上技术路线均存在较明显的缺点:关键词匹配模型,泛化能力不足, 且需要知识库人员手动录入关键词,知识库维护成本较高。
发明内容
有鉴于此,本发明要解决的技术问题是提供一种基于混合模型的问答机 器人系统及问答机器人,能够提高模型的泛化能力和答案的准确性。
本发明的技术方案是这样实现的:
一种基于混合模型的问答机器人系统,包括:
获取模块,所述获取模块用于获取用户问句q;
预处理模块,所述预处理模块用于对所述用户问句q进行预处理;
混合模型,所述混合模型包括词对齐模型和句子向量模型,所述词对齐 模型用于计算所述用户问句q和知识库{X}中例句xi,j的语义相似度,并计算所 述用户问句q属于每个类别i的概率;所述句子向量模型用于将所述用户问句 q转化为句向量,并计算所述用户问句q属于每个类别i的概率;
模型融合模块,所述模型融合模块用于将词对齐模型和句子向量模型融 合,获取所述用户问句q属于每个类别i的概率;
输出模块,所述输出模块用于输出所述用户问句q对应的概率最高的类 别i对应的答案。
优选的,所述预处理用于对所述用户问句q中的英文、标点符号、和命 名实体进行归一化处理。
优选的,所述知识库的结构为:M个类,每个类有k个例句;分类库共 有N个例句,分类库所有例句集合为{X};分类库{X}中例句表示为:xi,j∈{X} 其中:i∈[1,M],j∈[1,k],xi,j表示第i个分类里面的第j个例句。
优选的,所述计算所述用户问句q和知识库{X}中例句xi,j的语义相似度具 体包括:
S11、对所述用户问句q和例句xi,j进行分词标注;
S12、提取特征;
S13、设特征集合为f,模型参数为V,V为每个特征的权重,相似度得分 为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海八斗智能技术有限公司,未经上海八斗智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911260339.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于保护APK的方法和装置
- 下一篇:订单查询方法及系统





