[发明专利]一种基于知识增强图卷积网络的答案选择方法及系统在审
| 申请号: | 202211464352.3 | 申请日: | 2022-11-22 |
| 公开(公告)号: | CN116028604A | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 陈羽中;郑超凡;徐俊杰;李炜炜 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/35;G06F40/211;G06F40/289;G06F40/30;G06N3/0464;G06N3/048;G06N3/047;G06N3/084 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊;薛金才 |
| 地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 增强 图卷 网络 答案 选择 方法 系统 | ||
本发明提供了一种基于知识增强图卷积网络的答案选择方法及系统,包括以下步骤:步骤A:在问答平台中收集用户的问题以及回答记录,并标注每一个问题‑答案对的真实标签,以此构建训练集DS;步骤B:使用训练数据集DS以及知识图谱ConceptNet,训练基于知识增强的图卷积神经网络的深度学习网络模型M,通过此模型来分析给定问题,相对应候选答案的正确性;步骤C:将用户的问题输入到训练好的深度学习网络模型M中,输出匹配的答案;应用本技术方案有利于提高答案选择的准确性。
技术领域
本发明涉及自然语言处理技术领域,特别是一种基于知识增强图卷积网络的答案选择方法及系统。
背景技术
答案选择(Answer Selection)答案选择是问答领域的一个重要子任务,在信息检索(IR)和自然语言处理(NLP)的众多应用中发挥这十分重要的作用。随着互联网的迅速发展,互联网相继涌现了大量的问答社区,如:知乎,Quora,StackOverflow,等,人们热衷于在问答社区中提出问题,获取答案。在用户的长期广泛参与下,互联网上产生了海量问题-答案数据对,伴随着信息量的激增,通过人力的手段对于问答系统中的信息进行过滤和甄别变得难以为继;同时由于问答系统中网络信息的剧增,在问答系统中当前用户提出的问题常常被不断涌现的新问题所淹没,没有办法得到一个快速的响应。因此,迫切需要一种能够有效进行答案选择的自动化方法,判断问题和众多候选答案之间的匹配关系,从中选择出最佳答案并将其尽可能的排在答案列表前列。
随着深度学习方法研究的不断深入,许多研究人员也将深度学习模型应用到答案选择领域中。基于基于深度学习的问答匹配模型通常基于融合注意力机制的卷积神经网络(CNN)、循环神经网络(RNN)、图神经网络(GNN)或预训练语言模型。采用CNN获得问题、答案文本的局部语义信息。RNN可以构建文本序列的语义依赖关系。注意力机制使得模型能够更加关注问答对中关键语义部分。根据不同单词之间的文本关系例如句法关系将问答对抽象成图数据结构,GNN则可以根据不同单词之间的文本关系将问答对抽象成图数据结构,对图节点间的依赖关系进行建模。预训练语言模型的出现极大推动自然语言处理领域的发展。预训练语言模型可以从海量的无标注文本中学习到潜在的语义信息。一些研究学者开展将预训练语言模型应用于答案选择任务的研究工作。Devlin等人提出一个基于Transformer架构训练自然语言处理的通用模型BERT,并将其应用于答案选择任务。但是现有不论是采用神经网络还是基于预训练语言模型的答案选择模型主要专注于获得问题、答案文本中单词之间的上下文语义关联信息的特征表示,未充分考虑从语法结构的角度挖掘问题与答案之间的依赖信息,限制了模型对文本语义信息的理解。
此外,一些研究工作将知识图谱引入答案选择任务,也取得了一定进展。知识图谱中的事实背景包含大量实体信息,在问答匹配的过程中能够提供有效的常识性推理信息,提高答案选择的准确度。Li和Wu等人提出词网增强层次模型,利用WordNet中同义词集和上位词来增强问答句中的词嵌入表示,并设计了两个基于同义词集和上位词的关系分数的注意力机制,从而捕获更加丰富的问答交互信息,但是,现有的一些答案选择模型虽引入了知识图谱,但是知识实体之间缺少上下文语义关联且未有效引导实体信息帮助模型学习不同语境下的正确语义表示,限制了答案选择模型性能的提升。
发明内容
有鉴于此,本发明的目的在于提供一种基于知识增强图卷积网络的答案选择方法及系统,有利于提高选择正确答案的准确性。
为实现上述目的,本发明采用如下技术方案:一种基于知识增强图卷积网络的答案选择方法,包括以下步骤:
步骤A:在问答平台中收集用户的问题以及回答记录,并标注每一个问题-答案对的真实标签,以此构建训练集DS;
步骤B:使用训练数据集DS以及知识图谱ConceptNet,训练基于知识增强的图卷积神经网络的深度学习网络模型M,通过此模型来分析给定问题,相对应候选答案的正确性;
步骤C:将用户的问题输入到训练好的深度学习网络模型M中,输出匹配的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211464352.3/2.html,转载请声明来源钻瓜专利网。





