[发明专利]基于问句和知识图结构分析的自然语言问答方法及系统有效
| 申请号: | 201711204633.4 | 申请日: | 2017-11-27 |
| 公开(公告)号: | CN108052547B | 公开(公告)日: | 2019-09-27 |
| 发明(设计)人: | 袁平鹏;金海;李高峰 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F17/27 |
| 代理公司: | 华中科技大学专利中心 42201 | 代理人: | 廖盈春;李智 |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 问句 知识 结构 分析 自然语言 问答 方法 系统 | ||
1.一种基于问句和知识图结构分析的自然语言问答方法,其特征在于,包括:
(1)识别自然语言问句中的命名实体,并对所述自然语言问句进行解析以构建解析树;
(2)在所述解析树中采用以所述命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从所述解析树中抽取目标信息,构建所述自然语言问句的查询图;
(3)对于所述查询图中的每个节点,构建在预设知识图中与所述查询图中各节点相匹配的节点候选集;
(4)在所述预设知识图中以所述节点候选集中的每一个节点为中心进行遍历,得到以所述节点候选集中的每一个节点为中心的覆盖所有答案的子图;
(5)针对所述预设知识图中的路径构建路径语义向量,针对所述查询图中的边属性构建边属性语义向量;
(6)根据所述边属性语义向量与所述路径语义向量,计算所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,过滤掉不满足预设相似度要求的子图得到候选答案子图;
(7)根据所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案;
步骤(2)具体包括:
(2.1)根据识别到的全部命名实体设置实体集合;
(2.2)设置遍历过程关系提取集合,其中,所述遍历过程关系提取集合中的关系属性按照权重递减的顺序排列为:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod;
(2.3)判断所述实体集合中是否存在未被访问过的元素,若存在未被访问过的元素,则执行步骤(2.4),否则结束;
(2.4)以所述未被访问过的元素为根节点,在所述解析树中进行遍历搜索;
(2.5)在遍历过程中,判断所述解析树中表示关系的边的属性是否存在于所述遍历过程关系提取集合的关系属性中,若不存在,则执行步骤(2.4),若存在多个关系属性,则选择权重最高的关系属性所关联的边,然后执行步骤(2.6);
(2.6)判断权重最高的关系属性所关联的边所连接的节点是表示关系,还是表示实体,若表示关系,则在所述查询图中相应节点插入一条边;若表示实体,则执行步骤(2.7);
(2.7)将所述解析树中表示关系的边所连接的节点表示的实体插入到所述查询图中,并判断该插入的实体是否存在于所述实体集合中,若存在,则执行步骤(2.3),若不存在,则执行步骤(2.8);
(2.8)将该插入的实体插入到所述实体集合中,返回执行步骤(2.3)。
2.根据权利要求1所述的方法,其特征在于,步骤(5)具体包括:
(5.1)采用词向量技术训练得到预设词汇库中词汇的词向量;
(5.2)若获取所述预设知识图中路径的向量表示,则执行步骤(5.3),若获取所述查询图中表示关系的短语的向量表示,则执行步骤(5.4);
(5.3)求取所述知识图的路径中各个边的属性的向量表示,然后将所有边的向量叠加来获取所述知识图的路径的向量表示;
(5.4)区分所述查询图中表示关系的短语的核心词和修饰词,将所述修饰词的词向量映射到所述核心词的词向量中,以得到所述查询图中表示关系的短语的向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711204633.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种定制客户端用户界面的方法及装置
- 下一篇:碳氢化合物的卤化





