[发明专利]一种华文教育领域的多源知识图谱融合方法及装置在审
申请号: | 202110594900.3 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113204651A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 王华珍;赵荐轩;廖永新;吕挺;汪晓凤;喻小光 | 申请(专利权)人: | 华侨大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06Q50/20 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 华文 教育 领域 知识 图谱 融合 方法 装置 | ||
本发明公开了一种华文教育领域的多源知识图谱融合方法及装置,通过设计基于汉字、华文教学与华文教材的实体集与关系集,完成多源知识图谱的模式层设计,并在模式层的基础上,根据多源知识图谱各自的元数据构成,采用不同的方法完成多源知识图谱的构建。然后筛选具有教学用途的多源图谱共现实体节点,通过对其中的同义节点以及其关系进行合并,完成多源图谱的融合任务。本发明提供了一种针对现有华文教育领域知识碎片化解决方案,融合后的知识图谱对具有教学用途的知识信息进行了关联与整合,提升了其在华文教育领域的覆盖度与使用价值,为后续在知识图谱上进行的数据挖掘、个性化推荐与智能问答等工作提供了便利。
技术领域
本发明涉及知识图谱领域,具体涉及一种华文教育领域的多源知识图谱融合方法及装置。
背景技术
华文教育是以华侨华人子女为对象,以语言文化传承教育为目标的中文二语教学。它区别于国际中文教育,呈现汉语言教学和中华文化传承的并重特点。华裔青少年作为海外华侨华人的子女,一般得到了父母亲人的中文语言文化熏陶,具有一定的中文底蕴。这使得华文教育介于第一语言和第二语言教学之间,呈现出文化传承和第二语言教学的相融合的教学特色,自身积累了一系列高质量的华文教学领域教学资源。但上述教学资源组成类型复杂(异构)且往往来源于不同的教学组织或机构(多源)。多源异构数据的碎片化、关联性不足等特征容易导致“信息孤岛”、数据资源无法完成向知识的转化等问题,进而导致数据资源的价值无法得到充分挖掘。构建多源知识图谱即是对数据自身进行理解、分析,并提炼有效知识的重要途径。
知识图谱这一概念在2012年由谷歌提出并成功应用于搜索引擎当中。它通过结构化的形式描述客观世界中概念、实体与其之间的关系,实现了强大的语义处理能力和数据结构化组织能力,为数据挖掘、个性化推荐与智能问答等需要大量知识数据进行支撑的任务提供了基础。但是,对于异构数据知识图谱构建与多源知识图谱的融合,传统的数据库与分析挖掘技术工具几乎无能为力。
发明内容
针对上述提到的异构数据知识图谱构建与多源知识图谱的融合难度大等问题。本申请的实施例的目的在于提出了一种华文教育领域的多源知识图谱融合方法及装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请的实施例提供了一种华文教育领域的多源知识图谱融合方法,包括以下步骤:
S1,通过汉字学理知识构建以第一实体集Ec和第一关系集Rc构成的汉字学理三元组信息Gc,形式为Ei,Rj,Ek,其中Ei,Ek∈Ec,Rj∈Rc;
S2,通过华文教学知识构建以第二实体集Et和第二关系集Rt构成的华文教学三元组信息Gt,形式为Hi,Lj,Hk,其中Hi,Hk∈Et,Lj∈Rt;
S3,通过华文教材知识构建以第三实体集Eb和第三关系集Rb构成的华文教材三元组信息Gb,形式为Mi,Nj,Mk,其中Mi,Mk∈Eb,Nj∈Rb;第一实体集Ec、第二实体集Et与第三实体集Eb两两之间至少存在相同的实体节点构成共现实体集合;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594900.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卷烟机防护门联控装置
- 下一篇:一种触控按键结构及电子设备