[发明专利]一种基于知识图谱的自然语言问答实现方法和系统有效
申请号: | 201710139458.9 | 申请日: | 2017-03-10 |
公开(公告)号: | CN106934012B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 崔万云;梁家卿;肖仰华 | 申请(专利权)人: | 上海数眼科技发展有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 韩凤 |
地址: | 200000 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 自然语言 问答 实现 方法 系统 | ||
本发明公开了一种基于知识图谱的自然语言问题实现方法和系统,包括:在线部分模块,其中,所述在线部分模块,包括:复杂问题解析单元,用于接受用户提出自然语言问题,并对问题进行解析,如果问题是复杂性问题,则将其分解为一系列的二元事实型问题;概率推导单元,用于对每一个二元事实型问题,用概率推算的方法来找它的值,其中,该概率推算过程用到了P(P|T),即已知模板(template),对应谓语(predicate)的实体和值概率;知识图谱查询单元,用于从从预先训练的知识图谱中找到并返回答案。本发明以知识图谱为知识来源,以问题模板为表示问题、理解问题的基本单元,可以直线快速、准确的自然语言问题回答。
技术领域
本发明属于一种基于知识图谱的自然语言问答实现方法和系统。
背景技术
用于回答自然语言问题的问答(QA)系统已经在信息检索和自然语言领域吸引了大量的研究。QA系统通常被设计成能够回答一类特定问题的系统。例如,回答事实型问题是一个相对更容易实现的目标,也因此吸引了研究者的更多精力。事实型的问题是询问与客观事实相关的实体信息。一个典型的事实型问题的例子是二元事实型问题,如“how manypeople are there in Honolulu?”。二元事实型问题在询问一个实体(例如,Honolulu)中一个属性(例如,population)的值。二元事实型问题是很重要的,因为掌握二元事实型问题是回答更多复杂问题的第一步。很多的复杂事实型问题,如:1、)排名问题:“which cityhas the 3rd largest population?”;2、)比较问题:“which city has more people,Honolulu or New Jersey?”;3、)列举问题:“list the top 10 cities ordered”等,这些问题都只有在二元事实型问答得以解决后才能进行回答。因此,二元事实型问题的问答将是本问题的核心。
事实型问题也常被表述成更为复杂的形式,如“when was Barack Obama’s wifeborn?”。我们将这些问题归为复杂事实型问题(简称复杂问题)。如果我们能回答分别回答“Barack Obama’s wife”和“when was$e was born?”,那么我们也能回答刚才所说的问题。进一步说,一个复杂问题能够被分解成一系列的二元事实型问题。复杂问题也是我们关注的焦点。
一个QA系统相当依赖于资料库的质量。过去的QA系统都是构建于并未结构化的文本数据。最近几年诞生了许多大规模结构化的知识库,如谷歌的Knowledge Graph,Freebase,和YAGO2。大多数的此类知识库采用了RDF作为知识的表示形式。换而言之,他们包含了数以百万级甚至亿级的SPO三元组(S、P、O分别表示subject,predicate和object)。比如说下图表示一个迷你知识库,包含了(a;name;Barack Obama),(a;marriage;b),(b;person;c)等知识。
发明内容
本发明所要解决的技术问题是提供一种基于知识图谱的自然语言问答实现系统和方法。
本发明解决上述技术问题所采取的技术方案如下:
一种基于知识图谱的自然语言问答实现系统,包括:在线部分模块,其中,所述在线部分模块,包括:
复杂问题解析单元,用于接受用户提出自然语言问题,并对问题进行解析,如果问题是复杂性问题,则将其分解为一系列的二元事实型问题;
概率推导单元,用于对每一个二元事实型问题,用概率推算的方法来找它的值,其中,该概率推算过程用到了P(P|T),即已知模板(template),对应谓语(predicate)的实体和值概率;
知识图谱查询单元,用于从从预先训练的知识图谱中找到并返回答案。
优选的是,还包括:离线部分模块,所述离线部分模块,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数眼科技发展有限公司,未经上海数眼科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710139458.9/2.html,转载请声明来源钻瓜专利网。