[发明专利]一种基于人工智能的实体关系对识别方法及系统在审
申请号: | 201711332925.6 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108052501A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 朱瑾鹏;黄诗剑 | 申请(专利权)人: | 北京数洋智慧科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京正鼎专利代理事务所(普通合伙) 11495 | 代理人: | 岳亚 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 实体 关系 识别 方法 系统 | ||
本发明公开了一种基于人工智能的实体关系对识别方法及系统,通过人工智能的方式,从训练语料库中自动分析句子并得到目标关系对应实体,然后结合两个或多个实体的时间属性,提取出符合时间属性的实体关系对,用以具体的语义分析。本实施例的方案,能够准确识别语句中实体关系对,从而能够准确分析语句中目标关系的词语以及短语的实际关系,从而准确识别语句的实际含义,为人工智能开展语义识别奠定基础。
技术领域
本公开涉及人工智能识别技术领域,具体涉及一种基于人工智能的实体关系对识别方法及系统。
背景技术
随着科技技术的迅猛发展,数据化时代下的各项数据呈现指数级规模的增长,且数据的形式也逐渐演变的更为复杂化。“数据信息超负荷”和“数据信息泛滥”的现象日益严重。
因而,基于人工智能技术,将机器学习方法与规则相结合,抽取实体信息关系的方式,可以有效帮助人们快速提取所需的有用信息,甚至隐含于信息下的隐性信息。
现有技术中,大多数的实体关系抽取主要集中在显性关系上,对于实体隐性关系的抽取相对较少。
发明内容
鉴于上述问题,提出了本公开以便提供一种克服上述问题或者至少部分地解决上述问题的基于人工智能的实体关系对识别方法及装置。
根据本公开的一个方面,提供了一种基于人工智能的实体关系对识别方法,其包括:
从训练语料库中获取出现正例的句子,将所述句子解析成链接语法解析形式;所述正例为存在目标关系的两个实体;
将所述链接语法解析形式的句子中链接符链接的两个实体替换为占位符;根据所述占位符和对应的链接符,提取得到正模式;
根据所述正模式,遍历所述训练语料库中句子;当能与所述正模式匹配并同时能够产生反例的句子的数量小于设定阈值时,保留所述正模式;
将所述训练语料库中句子按带时间属性实体关系抽取处理,得到带时间属性的所述正例;
将所述带时间属性的正例与所述正模式匹配,将能够匹配的所述带时间属性的正例中的两个实体、时间属性以及所述目标关系作为实体关系对。
所述方法还包括:
将所述训练语料库中句子按带时间属性实体关系抽取处理,得到带时间属性的链接语法解析形式;
将所述带时间属性的链接语法解析形式中的两个实体替换为占位符,并与所述正模式匹配;
将能够匹配的对应句子中的所述两个实体、时间属性以及所述目标关系作为实体关系对。
所述带时间属性实体关系抽取处理,包括:
获取所述训练语料库中的句子,将所述句子解析成链接语法解析形式;
根据所述句子的连接语法解析形式,提取目标关系的实体关系;
获取所有在所述句子中出现过的日期列表;
获取所述句子中包含在实体关系中的谓语;
获取所述句子中位于所述日期前的介词;
检测在所述句子的主语、谓语与日期前的介词之间,在链接语法结构中是否有一条直接的链接;
若是,通过所述句子所包含的与主语、谓语有链接的日期,构建新的时间关系;
循环执行上述过程,直到得到所述训练语料库中所有符合所述正例的句子。
所述带时间属性的正例,用如下方式表示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数洋智慧科技有限公司,未经北京数洋智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711332925.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:开放式鸡舍种类鉴别系统及方法
- 下一篇:后视镜驾培系统的使用方法