[发明专利]一种融合CNN与双向LSTM的智能问答方法及系统有效
申请号: | 201910497128.6 | 申请日: | 2019-06-10 |
公开(公告)号: | CN110222163B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 陈羽中;张衍坤;郭昆;张毓东 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 cnn 双向 lstm 智能 问答 方法 系统 | ||
本发明涉及一种融合CNN与双向LSTM的智能问答方法及系统,包括以下步骤:采集智能问答系统中的问题以及回答记录,构建问答对训练集
技术领域
本发明涉及自然语言处理与智能问答应用领域,,具体涉及一种融合CNN与双向LSTM的智能问答方法。
背景技术
问答(Question Answering,QA)系统起源于图灵测试,随着时间的发展,问答系统领域也发生了重大变革。按照处理的数据格式不同,问答系统分别经历了结构化知识库阶段、无结构文本阶段、基于问题.答案数据阶段。随着互联网的普及,网上出现了大量的文本和各种大型论坛,这为社区智能问答系统的兴起奠定了基础。2005年以来,互联网相继涌现了大量的问答社区,基于社区的问答系统逐渐成了问答系统的一个重要研究分支。
Yu等人提出了一种基于LSA(Latent Semannc Analysxs,LSA)一j的问题一答案匹配度计算方法,该方法统计分析大量问答句子,构建潜在语义空问,计算句子间的语义空间相似度,有效地解决了词的同义和多义问题。Carmel提出了一种改进的单词权重计算模型,加入了词语的词性和依赖关系等语法特性,这些特征被用来训练排序模型,验证了该方法的有效性。Bian等人提出一种针对事实类问题的答案获取框架GBrank,能够较好的从大规模的社交媒体信息中挖掘结构完好的事实类答案。Helman从句法角度探索问题和答案的相关性,将句子表示成句法树的形式,通过构造树状的编辑模型计算句子问的句法相似度。Ko等人将问题的所有答案属于最佳答案的可能性看成联合概率分布,概率分布中得分较高的候选答案被认为是该问题的最佳答案。
深度学习理论在答案抽取和排序任务上也有一定应用。Wang使用双向长短时记忆网络进行答案选择,将BILSTM与关键词匹配模型相结合,由B1LSTM输出问题答案间的匹配结果。Zhou等人将答案选择看成答案标注问题,首先使用卷积神经网络(ConvoluhonalNeural Network,CNN)抽取问题和答案的分布式表示,然后将联合表示作为循环记忆网络的输入,以学习所有答案与问题的匹配关系。
传统CQA系统使用有监督学习,训练答案排序和问题检索模型,但该方法需要抽取复杂的文本特征,特征工程需
要较多的工程经验,很难在特征构造上做到最优,并且该方法在新的数据集上泛化性能较差,对新数据集往往需求重新进行特征抽取和特征工程。目前基于深度学习的方法通常基于单一的卷积神经网络或循环神经网络,无法全面准确地提取影响智能问答精度的各项特征。
发明内容
有鉴于此,本发明的目的在于提供一种融合CNN与双向LSTM的智能问答方法,融合CNN与双向LSTM,能够全面准确地提取影响智能问答精度的各项特征。
为实现上述目的,本发明采用如下技术方案:
一种融合CNN与双向LSTM的智能问答方法,包括以下步骤:
步骤A:采集智能问答系统中的问题以及对应的回答记录,构建问答对训练集QA;
步骤B:采集智能问答系统中每个用户的问题回答记录,构建用户的历史回答训练集UA;
步骤C:根据问答对训练集QA和用户的历史回复训练集UA,训练融合CNN与双向LSTM的深度学习网络模型M;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910497128.6/2.html,转载请声明来源钻瓜专利网。