[发明专利]一种因果关系知识库的构建方法、装置及设备在审

专利信息
申请号: 201811494944.3 申请日: 2018-12-07
公开(公告)号: CN109308323A 公开(公告)日: 2019-02-05
发明(设计)人: 高云龙;朱明;郝志成;吴川 申请(专利权)人: 中国科学院长春光学精密机械与物理研究所
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 罗满
地址: 130033 吉林省长春市*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 因果关系 知识库 文本数据 数据源 构建 语句 计算机可读存储介质 文本数据处理 预设时间段 装置及设备 结果预测 判断数据 数据总量 数据量 集合 保证 返回 重建 学习
【权利要求书】:

1.一种因果关系知识库的构建方法,其特征在于,包括:

由数据源中获取文本数据,并将所述文本数据处理成多个语句;

由处理得到的多个语句中确定出存在因果关系的因果句,识别所述因果句中包含的实体对,并确定包含有识别得到的实体对的集合为因果关系知识库;其中,所述实体对包括原因实体及结果实体;

由所述数据源中获取文本数据的时刻开始每经过预设时间段,则判断所述数据源中变化的数据总量是否达到数据量阈值,如果是,则返回执行所述由数据源中获取文本数据的步骤,如果否,则确定无需重建构建因果关系知识库。

2.根据权利要求1所述的方法,其特征在于,确定任一语句是否为存在因果关系的因果句,包括:

确定任一语句为当前语句,判断当前语句中是否包含明确因果关系提示词集合中包含的任一明确因果关系提示词,如果是,则确定当前语句为因果句,如果否,则确定当前语句不为因果语句;其中,所述明确因果关系提示词为表明确定存在因果关系的因果关系提示词。

3.根据权利要求2所述的方法,其特征在于,确定当前语句不为因果语句之前,还包括:

如果当前语句中不包含明确因果关系提示词集合中包含的任一明确因果关系提示词,则判断当前语句中是否包含模糊因果关系提示词集合中包含的任一模糊因果关系提示词,如果是,则将当前语句转化为特征向量后输入至预先创建的分类器,如果所述分类器输出的结果为预设值,则确定当前语句为因果句,如果所述分类器输出的结果不为预设值,则确定当前语句不为因果语句,如果否,则执行确定当前语句不为因果语句的步骤;其中,所述模糊因果关系提示词为表明可能存在因果关系的因果关系提示词,所述分类器为利用多个具有模糊因果关系提示词的语句转换得到的特征向量及对应语句是否为因果句的标签训练得到的。

4.根据权利要求1所述的方法,其特征在于,确定包含有识别得到的实体对的集合为因果关系知识库之后,还包括:

将识别得到的实体对进行笛卡尔乘积配对,确定得到的多个实体对均为新实体对;

对所述新实体对包含的实体进行聚类操作,得到多个由因果关系实体集合组成的集合对,其中,每个因果关系实体集合中包含聚类操作中被归为同一类的原因实体或者结果实体;

保留每个集合对包含的在所述数据源中共现频率大于频率阈值的新实体对,删除其他实体对。

5.根据权利要求4所述的方法,其特征在于,还包括:

将每个保留的新实体对的共现频率加入至所述因果关系知识库中。

6.根据权利要求4所述的方法,其特征在于,还包括:

按照下列公式计算每个新实体对的支持度,并将每个新实体对的支持度加入至所述因果关系知识库中:

supportNum=(α*Adverb+β*SentenceType+γ*Emotion)*Negative;

其中,α、β及γ均为预先设定的权重系数,α>β>γ,且α+β+γ=1;supportNum为支持度,Adverb为新实体对应语句中包含的程度副词对应分数,SentenceType为新实体对应语句中包含的因果关系提示词对应分数,Emotion为新实体对应语句中包含的情感词对应分数,Negative为新实体对应语句中包含的否定词对应分数。

7.根据权利要求6所述的方法,其特征在于,还包括:

将待预测原因实体与最新得到的因果关系知识库中各原因实体进行比对,并输出与待预测原因实体匹配的原因实体对应新实体对包含的结果实体、新实体对对应的共现频率及新实体对对应的支持度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院长春光学精密机械与物理研究所,未经中国科学院长春光学精密机械与物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811494944.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top