[发明专利]一种用于特定领域问答系统的实现方法在审
申请号: | 202111138292.1 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113868392A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 龚波涛;朱琦峰;陈树藩;李春;王亚南 | 申请(专利权)人: | 国网上海市电力公司;上海铁新地理信息有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/28;G06F16/33;G06F40/289;G06F40/295 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵志远 |
地址: | 200122 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 特定 领域 问答 系统 实现 方法 | ||
本发明涉及一种用于特定领域问答系统的实现方法,包括:知识库构建子方法,基于知识图谱建立关系型数据库作为知识库;自然语言理解子方法,通过构建双向Transfomer的编码器表示模型,并将其微调为序列标注模型,通过训练好的序列标注模型获取问句的标签序列,在标签序列中提取关系要素,然后通过提取到的关系要素在知识库中查询答案。与现有技术相比,本发明具有精度高、反应速度快等优点。
技术领域
本发明涉及自然语言处理技术领域,尤其是涉及一种用于特定领域问答系统的实现方法。
背景技术
一般按知识来源分类,可将问答系统分为面向开放领域和面向特定领域的问答系统。面向开放领域的问答系统对问题内容的范围不加限制,问句句式变化大,且答案来源构建困难,实现难度自然较高。而面向特定领域的问答系统则主要关注某个特定领域,构建难度稍低,相对而言也有更多的发挥空间。
一般的基于信息检索的问答系统的工作,分为两步:问题解析和答案检索。问题解析是一项自然语言理解任务,它主要的工作从用户提出的问句中提取出有用的信息,进而指导后续的检索。答案检索则是从构建好的领域知识库中寻找答案。这向问答系统提出了两项任务:自然语言理解和知识库的构建。
问题解析的方法采用命名实体识别和词性标注这两项序列标注技术,也被称作槽位填充。序列标注是将输入的一句话视为一个输入序列,为其中的每个词标注上标签,这样可以将句子中重要的要素标注出来,如命名体、某个特定词性的词。常用的序列标注采用BIO格式,使用B、I标签来标注需要关注的词,使用O标签标注无需关注的词汇。早期的序列标注方法基于字典或规则,使用正则方法匹配,也确实比较适合特定知识领域的专有名词的标注。但是中文表达形式多样,若遇到较长的短语,需要进行大量的分支判断,实现起来比较复杂。
随着神经概率语言模型的提出,目前出现了诸多基于神经网络解决自然语言处理问题的方法。最常用的方法是基于循环神经网络和其作为其改进的长短期记忆网络,在已标记的预料数据集上有监督地学习,在这些任务上取得了比较好的效果。而且比起基于支持向量机、隐藏马尔可夫等模型的传统机器学习方法,能够更好地解决自然语言处理领域数据稀疏的挑战,有着更好的泛化性能。循环神经网络每一时刻的状态,不仅取决于网络的输入,还取决于上一时刻网络的状态,能够学习到上下文内容。而长短期网络则在其基础上提出了门机制,以解决数据在网络中传播距离过长导致的梯度爆炸和梯度消失问题。然而目前循环神经网络和长短期网络在处理自然语言处理任务中还存在并行能力差、难以同时兼顾上下文的问题,导致运行效率低、泛化能力不够高、优化困难。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种精度高、反应速度快用于特定领域问答系统的实现方法。
本发明的目的可以通过以下技术方案来实现:
一种用于特定领域问答系统的实现方法,所述的问答系统实现方法包括:
知识库构建子方法,基于知识图谱建立关系型数据库作为知识库;
自然语言理解子方法,通过构建双向Transfomer的编码器表示模型,并将其微调为序列标注模型,通过训练好的序列标注模型获取问句的标签序列,在标签序列中提取关系要素,然后通过提取到的关系要素在知识库中查询答案。
优选地,所述的知识库构建子方法包括:
步骤1-1:获取该特定领域资料中各名词性短语,将其定义为实体;
步骤1-2:基于知识图谱,使用关系描述两个实体间的关系;
步骤1-3:建立关系型数据库。
更加优选地,所述的步骤1-2中两个实体之间的关系通过关系发生时间以及关系类型这两个要素来描述。
更加优选地,所述的步骤1-3具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;上海铁新地理信息有限公司,未经国网上海市电力公司;上海铁新地理信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138292.1/2.html,转载请声明来源钻瓜专利网。