[发明专利]一种面向无结构文本智能问答的方法和系统有效
申请号: | 201710985745.1 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107679224B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 简仁贤;王海波 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 安娜 |
地址: | 200120 上海市浦东新区自由贸*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 结构 文本 智能 问答 方法 系统 | ||
1.一种面向无结构文本智能问答的方法,其特征在于,包括:
S1,编码层将获取到的文本和问题分别进行编码,得到文本隐藏向量和问题隐藏向量;
S2,信息融合层将所述文本隐藏向量和所述问题隐藏向量融合起来,并得到融合后的关联向量组;
S3,解码层根据所述关联向量组对所述文本进行解码,得到所述问题的答案,并输出所述答案;
所述S1具体方法为:
S11,获取输入的文本和问题;
S12:对所述文本和所述问题进行分词,得到文本词组和问题词组;
S13:将所述文本词组和所述问题词组分别映射到对应的词向量,得到文本词组向量和问题词组向量;
S14:应用双向循环神经网络对所述文本词组向量和所述问题词组向量进行编码,得到文本隐藏向量和问题隐藏向量;
所述S2具体为:
将问题隐藏向量的最后一个隐藏向量与文本隐藏向量中的每个隐藏向量进行加权操作,计算相似值
将相似值ai与文本隐藏向量中的每个隐藏向量相乘,计算融合后的关联向量组
2.根据权利要求1所述的一种面向无结构文本智能问答的方法,其特征在于,所述S12具体方法为:
对文本C和问题Q分别进行分词,得到文本词组C1:和问题词组Q1:其中为文本词组中第i个词,为问题词组中第j个词,n为文本词组中词的总个数,m为问题词组中词的总个数。
3.根据权利要求2所述的一种面向无结构文本智能问答的方法,其特征在于,所述S13具体方法为:
将文本词组C1:和问题词组Q1:分别映射到对应的词向量,得到文本词组向量C2:和问题词组向量Q2:其中为对应的词向量,为对应的词向量。
4.根据权利要求3所述的一种面向无结构文本智能问答的方法,其特征在于,所述S14具体为:
应用双向循环神经网络对文本词组向量C2:和问题词组向量Q2:分别进行编码,得到文本隐藏向量C3:和问题隐藏向量Q3:其中为对应的隐藏向量,为对应的隐藏向量,其中
5.根据权利要求4所述的一种面向无结构文本智能问答的方法,其特征在于,
其中,表示隐藏向量的转置,ws为参数矩阵;
Hi=aihiC。
6.根据权利要求5所述的一种面向无结构文本智能问答的方法,其特征在于,所述S3具体为:
将融合后的关联向量组合并在一起,g=concat(Hi),将合并后的向量g作为两个不同的全连接网络的输入,两个不同的全连接网络包括第一全连接网络和第二全连接网络,第一全连接网络的输出值为预测答案开始位置的概率分布p1,第二个全连接网络的输出值为预测答案结束位置的概率分布p2,
p1=softmax (w1g)
p2=softmax (w2g)
其中w1和w2为参数,计算答案的开始位置ps和结束位置pe,
ps=argmax (p1)
pe=argmax (p2)
在所述文本中,提取开始位置ps和结束位置pe之间的文本内容作为问题的答案并输出答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710985745.1/1.html,转载请声明来源钻瓜专利网。