[发明专利]一种基于多模态数据的甲骨学知识图谱构建方法及系统在审
| 申请号: | 201911045353.2 | 申请日: | 2019-10-30 |
| 公开(公告)号: | CN110807100A | 公开(公告)日: | 2020-02-18 |
| 发明(设计)人: | 熊晶;翟雪;高峰;焦清局;葛彦强;史小松;张展;刘永革 | 申请(专利权)人: | 安阳师范学院 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
| 代理公司: | 北京修典盛世知识产权代理事务所(特殊普通合伙) 11424 | 代理人: | 杨方成 |
| 地址: | 455000 河南省安阳市弦歌*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多模态 数据 甲骨 知识 图谱 构建 方法 系统 | ||
本发明公开了一种基于多模态数据的甲骨学知识图谱构建方法及系统,构建方法包括以下步骤:S1、分别对甲骨学文献、甲骨学数据库、甲骨学文本、甲骨文图像、甲骨文本体进行实体提取和关系提取;S2、进行实体对齐和关系融合构成多模态融合图谱;S3、利用本体推理和规则推理,挖掘获取隐含语义关系;S4、将隐含语义关系扩充到多模态融合图谱中,最终构成甲骨学知识图谱。本发明甲骨学文献、著录、数据库、语料库、视频、图像、3D模型等多种形式,体现出多模态特征,将实体和关系进行知识融合,并通过挖掘隐含语义构建甲骨学知识图谱,从而发现显式的实体和关系背后隐藏的潜在实体和关系,知识关联强。
技术领域
本发明属于甲骨文信息处理技术领域,具体涉及一种基于多模态数据的甲骨学知识图谱构建方法及系统。
背景技术
甲骨文是现今已发现的成体系的最早文字,是中华民族传统文化的瑰宝。甲骨文因其记录了3000年前殷商时期各方面的事件,具有极高的文物价值、史料价值和研究价值。从1899年甲骨文被发现以来,经海内外学者近120年前赴后继的探索,甲骨文的历史奥秘逐渐揭开,针对甲骨文的研究崭然成为一门举世瞩目的国际性显学—甲骨学。甲骨学是以甲骨文和它的载体卜甲、卜骨及相关考古学现象为研究对象,整合古文字学、历史学、历史文献学、文化人类学等多个学科的理论、方法和材料探析甲骨文和甲骨自身规律及商周历史文化的专门性学科。但是传统的甲骨学研究方法存在知识体系庞大、学习难度高、学习周期长、知识关联性弱、知识共享程度低等问题。
发明内容
为解决现有技术存在的缺陷,本发明提供一种基于多模态数据的甲骨学知识图谱构建方法及系统。
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明提供一种基于多模态数据的甲骨学知识图谱构建方法,包括以下步骤:
S1、分别对甲骨学文献、甲骨学数据库、甲骨学文本、甲骨文图像、甲骨文本体进行实体提取和关系提取;
S2、对步骤S1提取的实体以及实体之间的关系进行实体对齐和关系融合,构成多模态融合图谱;
S3、利用本体推理和规则推理,挖掘获取隐含语义关系;
S4、将隐含语义关系扩充到多模态融合图谱中,最终构成甲骨学知识图谱。
作为本发明的一种优选技术方案,甲骨文文献为甲骨学科学知识图谱的构建提供文献元数据信息,甲骨文文献模块利用甲骨学科学知识图谱显示甲骨文知识关联、知识演化及知识群结构;实体为研究机构、学者、地点、人物、事件中的一种或多种;实体之间的关系为合作、被引、共现、为…提供依据、主体、分期、类组、材质、祭祀对象、继承中的一种或多种;采用共引、共词、聚类分析中的一种或多种方法进行实体提取和关系提取。
作为本发明的一种优选技术方案,甲骨学数据库包括甲骨文词典数据库、甲骨文著录数据库、甲骨文文献数据库、甲骨语法库中的一种或多种;甲骨学数据库中的关系、关系属性、属性的原子数据类型、属性约束、主键/外键为知识图谱的构建提供了概念或类及其关系的描述。
作为本发明的一种优选技术方案,甲骨学文本为除甲骨学文献、甲骨学数据库、甲骨文释文之外涉及的甲骨文知识的文本。甲骨学文本经过语义依存分析进行实体提取和关系提取。
作为本发明的一种优选技术方案,甲骨学文本经过语义依存分析进行实体提取和关系提取,具体包括以下步骤:依存句法分析与甲骨文语法启发式规则项结合,再根据距离确定论元位置,抽取出三元组,并以此建立实体间的关系。
作为本发明的一种优选技术方案,甲骨文图像进行甲骨字检测进行实体提取和关系提取,具体包括以下步骤:利用RFBNet算法检测甲骨文图像中的甲骨字,然后将单个甲骨字分离出来,从而获得甲骨字与甲骨文图像的关系、以及甲骨字的相关异体字,并建立异体字关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安阳师范学院,未经安阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911045353.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汉语选词填空方法
- 下一篇:一种云VR展示与销售系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





