[发明专利]一种基于跨模型、跨语言知识建模的知识挖掘方法在审
申请号: | 202111112651.6 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113836265A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 方明;赵蔚彬;岳晨;刘世刚;代勋勋;方宸;任国政 | 申请(专利权)人: | 中国人民解放军军事科学院战争研究院外国军事研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/36;G06F40/295;G06F40/30 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 周恒 |
地址: | 100091 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 语言 知识 建模 挖掘 方法 | ||
本发明属于知识挖掘技术领域,具体涉及一种基于跨模型、跨语言知识建模的知识挖掘方法。本发明挖掘方法实施过程中,对多语言新闻知识进行挖掘,其所构建的不同知识模型之间具有一定的隔离性,同时具有一定的关联性,针对不同的源语言素材和知识模型,采用监督知识抽取方法和非监督知识抽取方法相结合的方式进行知识抽取,并将知识抽取过程获取到的知识和知识模型进行映射,在跨语言知识融合层面上,基于开源百科库、开源知识库实现跨语言知识库建设,基于跨语言链接进行知识融合对齐。最终,完成跨模型、跨语言知识建模及知识挖掘,获得所需的跨语言新闻知识库。
技术领域
本发明属于知识挖掘技术领域,具体涉及一种基于跨模型、跨语言知识建模的知识挖掘方法。
背景技术
随着开源新闻文本数据爆炸式的增长,传统的数据检索和浏览方式已经无法满足研究需求。由于研究的方向逐渐细分,研究人员迫切需要跨国家模型、跨语言的知识图谱技术,从繁杂的自然语言中提炼出关心的目标实体和实体之间存在的关系,从而从中挖掘潜在的高价值信息。
知识图谱自谷歌于2012年提出以后,备受学术界和工业界的关注,在各个领域得到广泛的研究和应用。目前谷歌、百度、阿里、腾讯等头部互联网企业,以及明略、星环等新兴企业都建立了知识图谱框架和技术,旨在利用知识图谱提高数据应用能力。传统上,知识图谱构建的流程包括知识建模、数据引接、知识映射、知识抽取和知识融合,最终形成知识图谱,从而为上层应用提供知识数据支撑。
中国专利“CN112199511A”跨语言多来源垂直领域知识图谱构建方法,垂直领域翻译根据输入的跨语言文本、领域词典、领域术语库、领域素材和数据,通过内容和链接分析完成平行语料库构建,在预处理的基础上基于训练好的翻译模型实现外文文本的自动翻译,结合垂直领域翻译数据和实际场景完成语义特征提取和基于深度学习的实体关系抽取;领域知识融合与消歧对不同来源知识,通过网络等价实体合并进行融合消歧,获得跨语言多来源垂直领域知识图谱。
传统知识图谱构建往往针对单一知识模型和单一语言文本,无法解决跨语言、跨知识模型的知识挖掘。中国专利“CN112199511A”中的跨语言知识图谱构建也仅是针对单一知识模型,且该专利中跨语言是通过机器翻译文本实现,并不是真正的跨语言知识图谱构建,因此无法满足新闻研究领域现有的跨模型、跨语言知识图谱构建应用需求。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何根据用户对跨模型建模、跨语言知识抽取的需求,如何提出一种跨模型、跨语言知识图谱构建技术,方便研究人员对自身研究方向建模,并针对自身方向语言采集数据进行原文知识抽取,并通过跨语言知识链接实现知识的融合。
(二)技术方案
为解决上述技术问题,本发明提供一种基于跨模型、跨语言知识建模的知识挖掘方法,所述方法包括如下步骤:
步骤1:针对不同国家分别进行知识建模,包括多层级实体概念建模、实体属性建模和逻辑关联关系建模;该步骤1包括具体步骤如下;
步骤11:在知识建模后台系统中针对不同国家分别创建各自的知识模型,分别以国家名称对不同国家对应的知识模型进行创建并命名,然后为每个知识模型创建依据兼属关系约束的多层级实体概念;所述多层级实体概念包括:一级实体概念、二级实体概念;其中,所述一级实体概念包括:组织机构、人物、地点、武器装备;二级实体概念为某个一级实体概念下属的子集,两者之间在兼属关系存在包含与被包含的关系;
步骤12:针对每个特定的实体概念创建其对应的实体属性;其中,对于组织机构而言,其实体属性包括:成立时间、总部所在地、规模、人数;对于人物而言,其实体属性包括:年龄、性别、职务、出生地、学历;对于地点而言,其实体属性包括:气候、经纬度;对于武器装备而言,其实体属性包括长度、重要、作战半径、威力;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院战争研究院外国军事研究所,未经中国人民解放军军事科学院战争研究院外国军事研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111112651.6/2.html,转载请声明来源钻瓜专利网。