[发明专利]一种问答处理方法、装置及问答系统在审
| 申请号: | 201910213110.9 | 申请日: | 2019-03-20 |
| 公开(公告)号: | CN109947922A | 公开(公告)日: | 2019-06-28 |
| 发明(设计)人: | 李秀江 | 申请(专利权)人: | 浪潮商用机器有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 250100 山东省济南市历城区唐冶新*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 答案特征向量 问题特征 答案库 答案 向量 应答 余弦相似度 问答系统 卷积神经网络 神经网络 双向循环 输出 匹配性 申请 | ||
1.一种问答处理方法,其特征在于,包括:
获取问题和待选答案库;所述待选答案库包含多个待选答案;
将所述问题和所述待选答案库输入预先训练好的应答模型中,得到所述应答模型输出的最终答案;所述应答模型包括:双向循环神经网络Bi-LSTM层和卷积神经网络CNN层,所述Bi-LSTM层的输出作为所述CNN层的输入;
所述应答模型,用于根据所述问题和所述待选答案库分别获得问题特征向量和每个待选答案对应的答案特征向量;分别获取每个所述答案特征向量与所述问题特征向量的余弦相似度;将与所述问题特征向量的余弦相似度最高的答案特征向量对应的待选答案作为所述问题的最终答案输出。
2.根据权利要求1所述的方法,其特征在于,所述应答模型还包括:池化层;所述CNN层的输出作为所述池化层的输入;所述池化层,用于对所述CNN层的输出进行二次采样,得到所述问题特征向量和每个所述待选答案对应的答案特征向量。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
获取问题语料库;所述问题语料库中包含多个问题语料;
提取每个所述问题语料中的关键词;
对每个所述问题语料中的关键词进行扩展,获得扩展后的关键词;
根据所述扩展后的关键词,对每个所述问题语料进行分类,并提取分类后的问题语料的主题;
获得每个问题语料的答案语料;
根据所述分类后的问题语料、所述分类后的问题语料的主题以及所述每个问题语料的答案语料,构建所述应答模型的训练集和测试集;
利用所述训练集训练所述应答模型的参数;
利用所述测试集调整所述参数,获得训练好的应答模型。
4.根据权利要求3所述的方法,其特征在于,所述对每个所述问题语料中的关键词进行扩展,具体包括:
利用同义词词库对每个所述问题语料库中的关键词进行扩展;
和/或,通过词性组合构建复合词的方式对每个所述问题语料库中的关键词进行扩展。
5.根据权利要求1或2所述的方法,其特征在于,所述应答模型中所述Bi-LSTM层采用注意力机制对输入的所述待选答案进行选择。
6.一种问答处理装置,其特征在于,包括:
第一获取模块,用于获取问题;
第二获取模块,用于获取待选答案库;所述待选答案库包含多个待选答案;
应答模型处理模块,用于将所述问题和所述待选答案库输入预先训练好的应答模型中,得到所述应答模型输出的最终答案;所述应答模型包括:双向循环神经网络Bi-LSTM层和卷积神经网络CNN层,所述Bi-LSTM层的输出作为所述CNN层的输入;
所述应答模型,用于根据所述问题和所述待选答案库分别获得问题特征向量和每个待选答案对应的答案特征向量;分别获取每个所述答案特征向量与所述问题特征向量的余弦相似度;将与所述问题特征向量的余弦相似度最高的答案特征向量对应的待选答案作为所述问题的最终答案输出。
7.根据权利要求6所述的装置,其特征在于,所述应答模型还包括:池化层;所述CNN层的输出作为所述池化层的输入;所述池化层,用于对所述CNN层的输出进行二次采样,得到所述问题特征向量和每个所述待选答案对应的答案特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮商用机器有限公司,未经浪潮商用机器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910213110.9/1.html,转载请声明来源钻瓜专利网。





