[发明专利]一种基于语义分析的概念数据模型自动转换方法有效
申请号: | 201910831201.9 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110704522B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王铁鑫;曹静雯;李文心 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/2458 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王恒静 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 分析 概念 数据模型 自动 转换 方法 | ||
1.一种基于语义分析的概念数据模型自动转换方法,其特征在于,包括:
(1)将概念语义网络数据库中的单词及其之间关系导入至Neo4J数据库;
选取ConceptNet中的中英文概念,存入Neo4J,对于源文件csv的导入,首先需要进行分隔处理,找出有向边的头节点、尾节点和边上的关系及可信度;
(2)分析Neo4J数据库中的单词间的关系,进而计算两个单词之间的语义比较关系值;
(3)从源元模型集合中选择两个元模型,根据所述语义比较关系值检测两个元模型之间的概念映射关系,对应得到匹配成功的元模型中的实体和属性,并分别将匹配不成功元模型中属性及其所在实体存储进新源元模型;
(4)迭代步骤(3),得到所有源元模型之间的潜在概念映射关系,扩充新源元模型;
(5)将得到的新源元模型和目标元模型进行匹配,匹配成功的部分作为元模型转换规则,得到具有潜在映射的实体和属性,并最终建立多个源元模型到一个目标元模型的转换规则。
2.根据权利要求1所述的基于语义分析的概念数据模型自动转换方法,其特征在于,所述步骤(2)中,分析Neo4J数据库中的单词间的关系,具体包括:
(21)采用词干提取算法确定存在前后缀语义关系的单词;
(22)对来自相同域和不同域的单词进行语义检查测量,确定不同类型的语义关系及对应的语义关系值。
3.根据权利要求2所述的基于语义分析的概念数据模型自动转换方法,其特征在于,所述步骤(2)中,计算两个单词之间的比较关系值,具体包括:
(23)计算两个单词之间的编辑距离SynS,若所述编辑距离SynSα,则比较关系值为1,其中,α为设定阈值;
(24)若两个单词之间的编辑距离SynS≤α,则比较关系值为两个单词之间的语义关系值S_CV:若两单词存在直接语义关系,则所述直接语义关系对应的语义关系值为两个单词的语义关系值S_CV;否则,若两单词存在迭代语义关系,则两单词之间每条路径的语义关系值为路径上所有关系的语义关系值的乘积,并取最大的关系值作为S_CV。
4.根据权利要求3所述的基于语义分析的概念数据模型自动转换方法,其特征在于,所述直接语义关系为两单词之间路径长度为1个有向边的语义关系,有向边是从源元模型的属性或实体名称指向目标模型的属性或实体名称的边,或者是具有双向语义关系的边;所述迭代语义关系为基于固定语义关系下两单词之间路径长度大于1个边时的语义关系,所述固定语义关系包括:Synonym、SimilarTo、DerivedFrom、IsA、InstanceOf、RelatedTo和DistinctFrom。
5.根据权利要求1所述的基于语义分析的概念数据模型自动转换方法,其特征在于,所述步骤(3),根据所述语义比较关系值检测源元模型到目标模型之间的概念映射关系,所述元模型包括2个及以上的源元模型和一个目标元模型,每个元模型包括不少于一个的实体,每个实体包括不少于一个的属性,属性解析为属性名称和对应属性类型,检测过程包括:
第一匹配:(31)选择两个源元模型作为一对源元模型和目标元模型,根据语义比较关系值计算源元模型和目标元模型中一对实体对应每对属性的相似度;
(32)根据每对属性的相似度和实体名称的语义相似度计算该对实体的相似度;
(33)对每对属性的相似度和实体的相似度分别预设阈值范围[σ,ζ],并将相似度结果与阈值进行比较,σζ,若大于ζ,则对应的实体或属性直接判断为匹配成功,若小于σ,则匹配失败,若在σ~ζ之间,则用户自定义是否匹配成功;
(34)针对每对实体都进行步骤(31)-(33)的比较,得到匹配成功的实体对和属性对;
第二匹配:(35)对于匹配失败的源元模型中的属性和目标元模型中的属性,根据所属实体名称的语义相似度和属性名称的语义相似度计算这些属性之间的相似度,寻找匹配成功的属性对,属性对为第一匹配中匹配失败的属性对应的实体和该属性的共同表示;
第三匹配:(36)将第一匹配和第二匹配后源元模型的所有匹配失败的属性名称与目标元模型中的实体名称进行比较,将匹配失败的源元模型中属性及所在实体名以结构方式存储在新源元模型中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910831201.9/1.html,转载请声明来源钻瓜专利网。