[发明专利]一种基于混合模型的问答机器人系统及问答机器人在审
| 申请号: | 201911260339.4 | 申请日: | 2019-12-10 | 
| 公开(公告)号: | CN111190998A | 公开(公告)日: | 2020-05-22 | 
| 发明(设计)人: | 陈海飞 | 申请(专利权)人: | 上海八斗智能技术有限公司 | 
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/289;G06F40/30;G06K9/62;G06N3/04 | 
| 代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 夏允峰 | 
| 地址: | 200082 上海市*** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 混合 模型 问答 机器人 系统 | ||
1.一种基于混合模型的问答机器人系统,其特征在于,包括:
获取模块,所述获取模块用于获取用户问句q;
预处理模块,所述预处理模块用于对所述用户问句q进行预处理;
混合模型,所述混合模型包括词对齐模型和句子向量模型,所述词对齐模型用于计算所述用户问句q和知识库{X}中例句xi,j的语义相似度,并计算所述用户问句q属于每个类别i的概率;所述句子向量模型用于将所述用户问句q转化为句向量,并计算所述用户问句q属于每个类别i的概率;
模型融合模块,所述模型融合模块用于将词对齐模型和句子向量模型融合,获取所述用户问句q属于每个类别i的概率;
输出模块,所述输出模块用于输出所述用户问句q对应的概率最高的类别i对应的答案。
2.如权利要求1所述的基于混合模型的问答机器人系统,其特征在于,所述预处理用于对所述用户问句q中的英文、标点符号、和命名实体进行归一化处理。
3.如权利要求1所述的基于混合模型的问答机器人系统,其特征在于,所述知识库的结构为:M个类,每个类有k个例句;分类库共有N个例句,分类库所有例句集合为{X};分类库{X}中例句表示为:xi,j∈{X}其中:i∈[1,M],j∈[1,k],xi,j表示第i个分类里面的第j个例句。
4.如权利要求3所述的基于混合模型的问答机器人系统,其特征在于,所述计算所述用户问句q和知识库{X}中例句xi,j的语义相似度具体包括:
S11、对所述用户问句q和例句xi,j进行分词标注;
S12、提取特征;
S13、设特征集合为f,模型参数为V,V为每个特征的权重,相似度得分为:
score=f*V=∑jfj*vj
S14、用户问句q和知识库{X}中例句xi,j的语义相似度:
score=Similarity(q,xi,j)
则q与类别i的相似度取类别i里面所有相似度得分最大的值,作为q与类别i的相似度得分:
利用loglinear模型计算q属于每一个类别的概率:
可见p(i|q,X)满足如下条件:
5.如权利要求1所述的基于混合模型的问答机器人系统,其特征在于,所述将所述用户问句q转化为句向量,并计算所述用户问句q属于每个类别i的概率包括:
S21、将用户问句q转化为句子向量;
S22、设句子向量为Vector,则
Vector=SentenceModel(句子)
用户事件描述q和事件类别库{X}中例句xi,j的语义相似度为:
Vector(q)=SentenceModel(q)
Vector(xi,j)=SentenceModel(xi,j)
则句子相似度,为向量夹角的cos值:
利用loglinear模型计算q属于每一个类别的概率:
。
6.如权利要求1所述的基于混合模型的问答机器人系统,其特征在于,所述模型融合的概率分布函数为:
p(i|q,X)=α*F1(q,X)+β*F2(q,X)
其中,α+β=1,F1为词对齐模型,F2为句向量模型。
7.如权利要求5所述的基于混合模型的问答机器人系统,其特征在于,所述将用户问句q转化为句子向量包括:
将用户问句q通过卷积神经网络和深度神经网络转化为句子向量;
所述卷积网络卷积核为20-512;深度神经网络为1-20层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海八斗智能技术有限公司,未经上海八斗智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911260339.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于保护APK的方法和装置
 - 下一篇:订单查询方法及系统
 





