[发明专利]一种基于知识图谱的子图匹配自然问答方法在审
申请号: | 202011128379.6 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112214590A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 蒋畅江;李鹏华;王琴;张宇航 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/295;G06F40/30 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 杨柳岸 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 匹配 自然 问答 方法 | ||
本发明涉及一种基于知识图谱的子图匹配自然问答方法,属于计算机技术领域。当得到自然语言问题的一个正确匹配的查询子图时,歧义问题也同时解决;本发明不需要事先人工设立模板,且对复杂问句分析非常有效。本发明大致分为两个阶段:其一为问题理解,即将问题转换为逻辑形式;其二为查询评分,即对产生的结构化查询进行置信度评分。本发明为了将自然语言转换为查询图,提出了点优先(node‑first)的方法,首先从问句中抽取实体,再填充实体之间的边,来构成超语义查询图。该方法不需要事先人工设立模板,且对复杂问句分析非常有效。最终本发明能够完成子图匹配问答方法。
技术领域
本发明属于计算机技术领域,涉及一种基于知识图谱的子图匹配自然问答方法。
背景技术
大规模知识图谱的构建与应用需要多种技术的支持。通过知识提取技术,可以从一些公开的半结构化、非结构化和第三方结构化数据库的数据中提取出实体、关系、属性等知识要素。知识表示则通过一定有效手段对知识要素表示,便于进一步处理使用。然后通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。现有技术的缺点:1.基于规则的实现只能理解一小部分的问题。2.基于关键词或同义词的实现不能完整地理解问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于知识图谱的子图匹配自然问答方法。
为达到上述目的,本发明提供如下技术方案:
一种基于知识图谱的子图匹配自然问答方法,该方法如下步骤:
S1:节点识别;
S2:结构建立;
S3:得到超语义查询图QU;
S4:短语映射;
S5:查找超语义查询图QU的近似匹配。
可选的,所述S1具体为:用已有的方法识别出所有的实体指称,并且将所有wh-词和不能匹配到任何实体的名词作为通配符。
可选的,所述S2具体为:利用句法依存树,当两个节点之间没有其余节点存在,那么这两个节点之间即认为是有边或路径相连,即为一个关系指称,且路径上所有边的label组合为这个关系指称;
当两个节点之间的指称没有label时,若两个节点都为实体、类,那么在知识图谱中将这两个节点间的关系填入;若其中一个节点为通配符,则在知识图谱中定位另外一个节点,取与其连接频数最高的那些谓词作为候选关系填入。
可选的,所述S3具体为:首先将关系提到和节点短语分别映射到候选谓词/谓词路径和实体/类;其次考虑如何将未标记的边映射到知识图谱中的谓词;
如果两个节点都是常数,即实体或类,则将两个节点定位在知识图谱中并找出它们之间的谓词;
如果一个节点vi是一个通配符,另一个vj是一个实体或类,在知识图谱中定位vj,并选择最频繁的相邻谓词作为匹配边缘的候选谓词。
可选的,所述S4具体为:给出一个超语义查询图QU,讨论如何在知识图谱上找到具有top-k匹配分数的近似匹配;在QU中的一些边允许不匹配,而QU应该匹配所有节点,但以不同边连接所有节点的子图以Si表示;最后,收集每个Si的所有top-k匹配项,形成答案集,并报告答案集中匹配得分最高的k个匹配项。
本发明的有益效果在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011128379.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有辅助散热功能的制冷设备
- 下一篇:一种多级数据的处理方法及其相关产品