[发明专利]基于权重的链接多属性的实体识别方法无效
申请号: | 200810244679.3 | 申请日: | 2008-12-11 |
公开(公告)号: | CN101482876A | 公开(公告)日: | 2009-07-15 |
发明(设计)人: | 谢俊元;刘红星;雷钰丽;王崇骏 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京天翼专利代理有限责任公司 | 代理人: | 汤志武;王鹏翔 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明基于权重的链接多属性的实体识别方法,包括以下步骤:1)数据预处理阶段:a)收集节点间关系数据;b)确定节点之间权重的表现方式,包括权重属性定义以及权重属性计算方法;c)生成给定节点的四层联系图;d)结束;2)实体识别阶段:a)通过把1-c生成的联系图中链接多属性映射为单属性得到中间关联图;b)计算给定节点与中间关联图中的其他节点的相似度;c)进行相似度排序,得到相似度前几位的节点编号;d)结束;本发明的基于权重的链接多属性的实体识别方法,利用了实际中关系数据的权重和模式信息来进行相似度度量,以此扩展了传统的实体识别的相似度度量方法,并使用提出的相似度量方法成功解决了链接多属性的实体识别问题。 | ||
搜索关键词: | 基于 权重 链接 属性 实体 识别 方法 | ||
【主权项】:
1、基于权重的链接多属性的实体识别方法,其特征是包括如下步骤:1)数据预处理阶段:a)收集节点间关系数据;其中获得个体之间的通信数据,这些通信数据的获得从交换机的原始话单或者是运营商那里得到的计费数据;b)确定节点之间权重的表现方式,包括权重属性定义以及权重属性计算方法;根据现实需要来具体决定相应的权重的表现方式和统计标准;c)生成给定节点的四层联系图;具体过程如下:11)初始化队列,把给定的节点首先入队,并标记节点的层次为1层,标记为已访问过的节点;12)设定程序状态信息,表示当前处理的节点的层次为第1层;13)循环从队列中出队一个元素,同时得到此元素所在的层次,然后执行以下14到18步;14)从关系数据中得到出队节点的所有联系节点;15)针对没有被访问过的联系节点进行16-18步操作;16)从关系数据中统计出权重的各个属性信息;17)把节点以及它们的权重信息加入到关联图中;18)把处理过的联系节点放到队列中供下次遍历;d)结束;2)实体识别阶段:a)通过把步骤1-c)生成的联系图中的链接多属性映射为单属性得到中间关联图;具体过程如下:21)对给定权重向量与基准向量的各个属性的值进行比对,循环进行22,23两步操作;22)分别得到两个向量当前属性值的最小值和最大值;23)得到向量最小值的和以及最大值的和;24)计算两个向量之间的相似程度;25)把计算出来的相似度作为新的权重;b)计算给定节点与中间关联图中的其他节点的相似度;具体过程如下:31)对矩阵的每一行分别进行处理,循环进行32,33两步操作。32)计算矩阵当前行的所有元素的和33)分别对行的各个元素的值进行更新,更新的方法是当前的值除以所在行的所有值的和第32步计算得到的值;34)进行矩阵相乘运算得到相似度矩阵,35)更新得到的相似度矩阵,把有边相连的两个节点的相似度置为0;c)进行相似度排序,得到相似度前几位的节点编号;d)结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810244679.3/,转载请声明来源钻瓜专利网。