[发明专利]一种条件知识图谱的表示和构建方法在审
申请号: | 202210141390.9 | 申请日: | 2022-02-16 |
公开(公告)号: | CN114510581A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 杨晓春;徐自强;陈浩;郑婷月;王斌;张晓红 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06F40/205;G06F16/31 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 条件 知识 图谱 表示 构建 方法 | ||
1.一种条件知识图谱的表示和构建方法,其特征在于,具体为以下步骤:
步骤1:构建一种运用嵌套三元组,形式化的表达事实与条件三元组之间,以及条件三元组之间丰富层次语义关联的条件知识图谱表示方法;
步骤2:基于步骤1条件知识图谱表示方法,利用层次解析模块对条件语句的文本结构进行层次解析,得到一组文本单元及其文本单元之间的层次语义关系;
根据条件语句构造一颗修辞结构理论RST递归层次解析树,解析出条件语句中条件和事实、条件和条件、事实和事实之间的关系,同时将条件语句转化为多个文本单元并将其作为步骤3三元组抽取任务的输入;所述输入到步骤3的文本单元为条件单元和事实单元;
步骤3:利用三元组抽取模块对步骤2解析得到的文本单元,即条件单元和事实单元进行三元组的抽取,将文本单元转化为三元组,并将抽取得到的三元组代入层次解析树的叶子节点;最终得到用层次解析树表示的步骤1中条件知识图谱表示方法;
步骤4:根据步骤1的条件知识图谱表示方法和步骤3得到的层次解析树,设计层次解析树相应的物理存储和查询方案对条件知识图谱进行管理。
2.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,步骤1所述嵌套三元组为:
嵌套三元组中的头节点和尾节点可以为实体或者三元组。
3.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,步骤1所述表达事实与条件三元组之间,以及条件三元组之间丰富层次语义关联有三种类型,分别为:
实体,实体与实体之间关系,实体;
三元组,三元组与三元组之间关系,三元组;
三元组,三元组与实体之间关系,实体或者实体,实体与三元组之间关系,三元组。
4.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,所述步骤2条件语句为:
条件语句包括条件从句和结论句。
5.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,所述步骤2为:
步骤2.1:给定一个条件语句C:Ifc,f.,其中,“If”可替换为其他条件引导词;c表示若干条件的逻辑组合描述,f表示若干事实的逻辑组合描述;
步骤2.2:对条件语句C:Ifc,f.进行文本层次语义解析,构造一颗修辞结构理论RST递归层次解析树,最下面的叶子节点为一组文本单元(c1,...,cm,f1,...,fn,s1,...,sr};
步骤2.3:将一组文本单元{c1,...,cm,f1,...,fn,s1,...,sr}分类为三种类型,ci(i∈{1,...,m})是条件单元,fj(j∈{1,...,n}是事实单元,sk(k∈{1,...,r})是补充单元;
其中,条件单元和事实单元为结构完整的、只含有一个主谓结构的简单句,补充单元的形式为名词短语结构。
6.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,所述步骤3为:
步骤3.1:利用三元组抽取模块对步骤2解析得到的文本单元,即条件单元和事实单元进行三元组的抽取,将抽取得到的三元组代入层次解析树的叶节点位置,即得到树结构化的条件图谱表示模型;得到用层次解析树表示的步骤1中条件知识图谱表示方法;
步骤3.2:将层次解析树中的非叶节点作为关系边,自底向上地递归将非叶节点作为关系边连接两边的嵌套结构,直到递归到根节点,将步骤3.1得到的层次解析树转化为嵌套三元组条件知识图谱表示方法。
7.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,所述步骤4中层次解析树相应的物理存储为:
对于存储,把步骤3.1得到的层次解析树的树形结构视作有向无环图,将条件知识图谱存储到图数据库中;将层次解析树叶节点的三元组抽象为一个三元组节点,三元组节点的子节点是三元组中的头尾实体;根据步骤3得到的解析树结构,实现在图数据库的存储。
8.根据权利要求1所述的一种条件知识图谱的表示和构建方法,其特征在于,所述步骤4中层次解析树相应的查询方案为:
对于查询方面,从层次解析树的根节点开始自顶向下地遍历整棵层次解析树,在回溯时递归式的一层一层地将非叶节点作为关系边,连接非叶节点的子节点的嵌套结构,直到回溯到根节点,即可重新得到步骤1中条件知识图谱表示方法;将条件句作为层次解析树的根节点;为方便查询,存储时在实体中保存其相应的根节点,当查询某个实体时,就根据它所拥有的根节点查询到该节点所关联的全部条件句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210141390.9/1.html,转载请声明来源钻瓜专利网。