[发明专利]一种基于人工智能的实体关系对识别方法及系统在审
申请号: | 201711332925.6 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108052501A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 朱瑾鹏;黄诗剑 | 申请(专利权)人: | 北京数洋智慧科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京正鼎专利代理事务所(普通合伙) 11495 | 代理人: | 岳亚 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 实体 关系 识别 方法 系统 | ||
1.一种基于人工智能的实体关系对识别方法,其特征在于,包括:
从训练语料库中获取出现正例的句子,将所述句子解析成链接语法解析形式;所述正例为存在目标关系的两个实体;
将所述链接语法解析形式的句子中链接符链接的两个实体替换为占位符;根据所述占位符和对应的链接符,提取得到正模式;
根据所述正模式,遍历所述训练语料库中句子;当能与所述正模式匹配并同时能够产生反例的句子的数量小于设定阈值时,保留所述正模式;
将所述训练语料库中句子按带时间属性实体关系抽取处理,得到带时间属性的所述正例;
将所述带时间属性的正例与所述正模式匹配,将能够匹配的所述带时间属性的正例中的两个实体、时间属性以及所述目标关系作为实体关系对。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
将所述训练语料库中句子按带时间属性实体关系抽取处理,得到带时间属性的链接语法解析形式;
将所述带时间属性的链接语法解析形式中的两个实体替换为占位符,并与所述正模式匹配;
将能够匹配的对应句子中的所述两个实体、时间属性以及所述目标关系作为实体关系对。
3.如权利要求1所述的方法,其特征在于,所述带时间属性实体关系抽取处理,包括:
获取所述训练语料库中的句子,将所述句子解析成链接语法解析形式;
根据所述句子的连接语法解析形式,提取目标关系的实体关系;
获取所有在所述句子中出现过的日期列表;
获取所述句子中包含在实体关系中的谓语;
获取所述句子中位于所述日期前的介词;
检测在所述句子的主语、谓语与日期前的介词之间,在链接语法结构中是否有一条直接的链接;
若是,通过所述句子所包含的与主语、谓语有链接的日期,构建新的时间关系;
循环执行上述过程,直到得到所述训练语料库中所有符合所述正例的句子。
4.如权利要求3所述的方法,其特征在于,所述带时间属性的正例,用如下方式表示:
其中,Entity分别表示两个实体,Relation表示实体之间的关系类型,[t
5.如权利要求1所述的方法,其特征在于,所述链接语法解析形式,包括:
链接为链接句子中两个或两个以上词的平面无向图结构;链接任意两个词的为边;每条边都用链接符标注;链接符取自一个有限的符号集合,标明了一条句子中两个词之间的实体关系;
所述边和链接符满足链接语法生产规则;
符合上述形式的句子即为所述句子的链接语法解析形式。
6.如权利要求1所述的方法,其特征在于,所述正模式为一种逻辑结构,表征两个或两个以上的实体之间的逻辑关系;所述逻辑关系唯一对应两个实体之间的目标关系。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
当能与所述正模式匹配并同时能够产生反例的句子的数量大于等于设定阈值时,删除所述正模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数洋智慧科技有限公司,未经北京数洋智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711332925.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:开放式鸡舍种类鉴别系统及方法
- 下一篇:后视镜驾培系统的使用方法