[发明专利]一种基于自组织映射神经网络的异构数据属性关联方法有效
| 申请号: | 202010690533.2 | 申请日: | 2020-07-17 |
| 公开(公告)号: | CN112015854B | 公开(公告)日: | 2023-07-18 |
| 发明(设计)人: | 钱玉洁;张紫薇;张杰 | 申请(专利权)人: | 河海大学常州校区 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/36;G06N3/088 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 丁涛 |
| 地址: | 213022 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 组织 映射 神经网络 数据 属性 关联 方法 | ||
本发明公开了一种基于自组织映射神经网络的异构数据属性关联方法,可在多个异构数据库中,通过匹配实体进行属性关联。首先,以输入的待匹配属性为输出神经元,以首个数据库的所有属性为输入神经元,根据神经元的匹配度,选择一个获胜神经元。之后,以获胜神经元领域函数范围内所有神经元为输出神经元,以下一个数据库的所有属性为输入神经元,进行自组织迭代。此时,需计算获胜神经元的领域函数,根据领域函数值计算各输出神经元设定匹配度奖励值,并根据各神经元的匹配值,选择获胜神经元,该过程在所有数据库重复迭代。最后,提取所有迭代过程的获胜神经元,关联相关属性。
技术领域
本发明涉及在数据库中关联相关属性的方法,具体是一种基于自组织映射(SOM)神经网络的异构数据属性关联方法。
背景技术
数据属性的关联一般用于异构数据的融合应用,例如,搜索引擎的语义关联、知识图谱的知识融合等;海量异构数据中,人工神经网络是建模属性关联的有效途径。
自组织映射(Self-Organizing Map)神经网络是一种无监督、竞争型的人工神经网络。它运用竞争学习策略,依靠神经元之间互相竞争逐步优化网络,使用领域函数维持输入空间的拓扑结构。由于异构数据间存在实体的歧义、实体的共指等现象,基于竞争学习的自组织映射神经网络可以通过同义、近义实体的竞争及协作,有效构建关联拓扑结构,较适用于海量异构数据的属性关联。
发明内容
本发明提供了一种基于自组织映射(SOM)神经网络的异构数据属性关联方法,在多个异构数据库中,通过匹配实体进行属性关联。
本发明中主要采用的技术方案为:
一种基于自组织映射(SOM)神经网络的异构数据属性关联方法。在多个异构数据库中,通过匹配实体进行属性关联时,
具体步骤如下:
步骤1:初始化
进行首轮迭代,以输入的属性为输出神经元,以首个数据库的所有属性为输入神经元,根据神经元的匹配度,选择一个获胜神经元;
步骤2:计算奖励值
以获胜神经元领域函数范围内所有神经元为输出神经元,以下一个数据库的所有属性为输入神经元,进行自组织迭代;
此时,计算获胜神经元的领域函数,将领域函数值设定为奖励值,赋予所有领域半径内的神经元。获胜神经元获得最高奖励值,其他神经元与获胜神经元越相似,则获取更高的奖励值;
步骤3:输出神经元与输入神经元进行匹配度比较,在输入神经元中选择与任一输出神经元匹配度最高的神经元为获胜神经元,需进行输出神经元数*输入神经元数的匹配计算。此时,匹配度计算过程需代入各神经元设定的奖励值;
步骤4:迭代,重复步骤2,步骤3,遍历所有数据库;
步骤5:最终,提取所有迭代过程的获胜神经元,关联相关属性。
优选地,步骤1中根据神经元的匹配度,选择一个获胜神经元,具体计算公式如式(1)所示:
其中,i为输入神经元编号;N为输入神经元集合。
优选地,所述步骤2中奖励值的计算方法如式(2)所示:
其中,j为输入神经元编号;δ为0到1的常数,根据数据库间的相关性设定;k为迭代次数;g为最高匹配值;λ为领域半径。
优选地,所述步骤3中匹配度计算过程需代入各神经元设定的奖励值,计算方法如式(3)所示:
其中,j为输出神经元编号;K为输出神经元集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010690533.2/2.html,转载请声明来源钻瓜专利网。





