[发明专利]一种基于动态知识图谱的无模板通用智能问答方法有效
申请号: | 201911421447.5 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159385B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 朱丹;汪鹏;徐忠锴;崔睿龙;吴江恒;李名臣 | 申请(专利权)人: | 南京烽火星空通信发展有限公司;东南大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/295;G06F40/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 程斯佳 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 知识 图谱 模板 通用 智能 问答 方法 | ||
1.一种基于动态知识图谱的无模板通用智能问答方法,其特征在于,所述方法包括如下步骤:
步骤一、自然语言问句的命名实体识别,对输入的自然语言问句进行解析,从文本中识别出命名实体的指称项;
步骤二、问句中的关系抽取:构造应用业务相关的关系词典,对本体中出现的每一个关系构建近义词集合,当用户输入的自然语言问句中含有关系词典中的一个或多个词,则将每一个这样的词映射为一条对应的关系;
步骤三、根据本体将实体和关系映射为动态知识图谱子图,对于经过步骤一和步骤二识别出的实体和关系,结合本体结构和业务需求,动态地将每一个识别出的实体和抽取出的关系映射为一个图结构,作为动态知识图谱子图;
步骤四、合并动态知识图谱子图,结合问句中的结构信息定义启发式规则,将步骤三中得到的多个动态知识图谱子图合并为一个连通的、能充分表达原问句中语义信息的最终动态知识图谱;
所述步骤四中的动态知识图谱的子图合并具体包括:
利用启发式规则和语法依存结构对各个子图进行合并;
所述根据实体和关系得到的动态知识图谱子图需要经过合并才能成为连通的动态知识图谱,子图合并的过程包括:
(1)若对象节点
(2)枚举可以合并的节点中所有可以组合的情况,将依存分析结果中存在的实体-关系对进行优先组合,若组合结果与本体约束冲突,则抛弃依存分析结果,撤销先前的组合;
(3)对所有可以组合的情况采取默认组合策略将其进行组合,生成一个候选动态知识图谱;
(4)对每一个候选动态知识图谱,判断其是否连通;若连通,进入意图确定阶段,若不连通,则对该候选知识图谱进行隐含关系的添加;
当合并的子图不连通时,根据隐含关系列表向不连通的知识图谱中添加隐含关系,使得合并后的动态知识图谱是连通的;
添加隐含关系的流程包括:
(201)计算不连通的候选知识图谱的连通分量,由于该候选知识图谱不连通,则至少存在两个连通分量;
(202)对于默认关系列表中的每个关系,判断是否能将该关系添加到两个连通分量之间;若能添加,则用添加该关系后的知识图谱替换原来的知识图谱;
(203)判断新知识图谱是否连通若不连通,重复步骤(1)、(2)、(3),直到构建出连通的动态知识图谱或者没有隐含关系能添加到候选知识图谱中;
步骤五、确定问答意图,基于问句中的意图信息和已构建的最终动态知识图谱,确定用户的查询意图,并将最终动态知识图谱转化为可供知识库检索的形式化查询;
在给定动态知识图谱
(301)将
(302)判断问句
(303)判断候选节点集是否为空,若为空,则说明疑问词确定的类型与识别出的实体不完整或与疑问词有冲突,需要与用户交互,结束本次处理流程;
(304)候选节点集不为空时,判断候选节点集的大小是否为1,若不为1转(305),否则转(307);
(305)判断候选节点集中是否有空节点,若有空节点,删除非空节点后转(304),否则转(306);
(306)对候选意图节点中的每个结点,按照其出入与入度之差作降序排序,保留候选节点中排序最靠前的节点,删除其余节点;
(307)选择当前候选节点集中的唯一结点作为意图目标结点,输出结果。
2.根据权利要求1所述的一种基于动态知识图谱的无模板通用智能问答方法,其特征在于:所述步骤一中,对自然语言问句进行语义解析时,采用正则匹配与深度学习模型相结合的方式,识别出自然语言问句中存在的命名实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司;东南大学,未经南京烽火星空通信发展有限公司;东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421447.5/1.html,转载请声明来源钻瓜专利网。