[发明专利]一种问答处理方法、装置及问答系统在审
| 申请号: | 201910213110.9 | 申请日: | 2019-03-20 |
| 公开(公告)号: | CN109947922A | 公开(公告)日: | 2019-06-28 |
| 发明(设计)人: | 李秀江 | 申请(专利权)人: | 浪潮商用机器有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 250100 山东省济南市历城区唐冶新*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 答案特征向量 问题特征 答案库 答案 向量 应答 余弦相似度 问答系统 卷积神经网络 神经网络 双向循环 输出 匹配性 申请 | ||
本申请公开了一种问答处理方法、装置及问答系统,方法获取问题和待选答案库,其中待选答案库包含多个待选答案;将问题和待选答案库输入预先训练好的应答模型,得到模型输出的最终答案。应答模型包括双向循环神经网络层和卷积神经网络层。应答模型根据问题和待选答案库分别获得问题特征向量和每个待选答案对应的答案特征向量;分别获取每个答案特征向量与问题特征向量的余弦相似度;将与问题特征向量的余弦相似度最高的答案特征向量对应的待选答案作为最终答案输出。应答模型可获得表达更加准确的问题特征向量与答案特征向量,有效提高最终答案与问题的匹配性,提升用户的使用体验。
技术领域
本申请涉及自然语言处理技术领域,特别是涉及一种问答处理方法、装置及问答系统。
背景技术
问答功能是目前各类信息检索系统开发者力求提供给用户的一种高级功能。由于人工回答用户提出的问题需要的人力成本较高,因此,为节省人力成本,如何针对用户提出的问题智能自动地回答已经成为本领域急需解决的技术问题。
但是,现有的一些问答系统往往提供的回答与问题的匹配性较低,导致用户的使用体验较差。
发明内容
基于上述问题,本申请提供了一种问答处理方法、装置及问答系统,以提升回答与问题的匹配性,提升用户的使用体验。
本申请实施例公开了如下技术方案:
本申请第一方面,提供一种问答处理方法,包括:
获取问题和待选答案库;所述待选答案库包含多个待选答案;
将所述问题和所述待选答案库输入预先训练好的应答模型中,得到所述应答模型输出的最终答案;所述应答模型包括:双向循环神经网络Bi-LSTM层和卷积神经网络CNN层,所述Bi-LSTM层的输出作为所述CNN层的输入;
所述应答模型,用于根据所述问题和所述待选答案库分别获得问题特征向量和每个待选答案对应的答案特征向量;分别获取每个所述答案特征向量与所述问题特征向量的余弦相似度;将与所述问题特征向量的余弦相似度最高的答案特征向量对应的待选答案作为所述问题的最终答案输出。
可选地,所述应答模型还包括:池化层;所述CNN层的输出作为所述池化层的输入;所述池化层,用于对所述CNN层的输出进行二次采样,得到所述问题特征向量和每个所述待选答案对应的答案特征向量。
可选地,方法还包括:
获取问题语料库;所述问题语料库中包含多个问题语料;
提取每个所述问题语料中的关键词;
对每个所述问题语料中的关键词进行扩展,获得扩展后的关键词;
根据所述扩展后的关键词,对每个所述问题语料进行分类,并提取分类后的问题语料的主题;
获得每个问题语料的答案语料;
根据所述分类后的问题语料、所述分类后的问题语料的主题以及所述每个问题语料的答案语料,构建所述应答模型的训练集和测试集;
利用所述训练集训练所述应答模型的参数;
利用所述测试集调整所述参数,获得训练好的应答模型。
可选地,所述对每个所述问题语料中的关键词进行扩展,具体包括:
利用同义词词库对每个所述问题语料库中的关键词进行扩展;
和/或,通过词性组合构建复合词的方式对每个所述问题语料库中的关键词进行扩展。
可选地,所述应答模型中所述Bi-LSTM层采用注意力机制对输入的所述待选答案进行选择。
本申请第二方面,提供一种问答处理装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮商用机器有限公司,未经浪潮商用机器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910213110.9/2.html,转载请声明来源钻瓜专利网。





