[发明专利]基于异质网络时态语义路径相似度的人物唯一性识别方法有效
| 申请号: | 201310746652.5 | 申请日: | 2013-12-31 |
| 公开(公告)号: | CN103678279A | 公开(公告)日: | 2014-03-26 |
| 发明(设计)人: | 黄芳;朱磊 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
| 代理公司: | 中南大学专利中心 43200 | 代理人: | 胡燕瑜 |
| 地址: | 410083 湖南省*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 网络 时态 语义 路径 相似 人物 唯一 识别 方法 | ||
1.一种基于异质网络时态语义路径相似度的人物唯一性识别方法,其特征在于,包括以下步骤:
步骤1:建立异质社会关系网络:对社会活动事务数据库中的数据进行读取,建立基于异质性关系网络的图数据库,形成具有时间属性异质性关系网络;
步骤2:搜索时态语义路径:首先根据异质网络中的关系的不同语义对网络进行划分,然后分别在不同语义的关系网络中利用网络结构对人物对象之间的时态语义路径进行搜索,从而得到各个人物对象与其邻居节点之间的时态语义路径,再根据各关系的时间属性计算时态语义路径的时态权重;
步骤3:计算时态语义路径相似度 :分别在不同语义的关系网络中,利用异质关系网络的结构特征以及时态语义路径的时态权重值对网络中人物对象的相似度进行测算,从而得到每一对人物对象的具有不同语义的时态语义路径相似度;
步骤4:识别人物对象的唯一性:首先对每一对人物对象的时态语义路径相似度求算术平均值,然后按照该平均值对人物对象对进行排序,找出时态语义路径相似度取值小于设定阈值的人物对象对,这些人物对象节点为具有唯一性特征的人物对象。
2.根据权利要求1所述的基于异质网络时态语义路径相似度的人物唯一性识别方法,其特征在于,步骤1的具体步骤为:
从记录人物社会活动的网页或文档中抽取的人物社会活动事务记录数据库,其记录信息包括人物基本属性信息、社会活动事务以及关系活动发生的时间属性,将这些社会活动记录中的关系信息导入图数据库中;其中所有的人物或实体作为网络图中的节点,并具有其基本属性,活动关系作为网络图中的边,并具有起始节点、终止节点、活动类型以及时间属性,按照社会活动的不同类型遍历图数据库形成了独立的异质关系网络。
3.根据权利要求1所述的基于异质网络时态语义路径相似度的人物唯一性识别方法,其特征在于,步骤2的具体步骤为:
首先确定待搜索的人物对象和以及邻居节点之间的时态语义路径,然后根据关系和的时间属性计算关系的时态权重以及由两条关系和构成的时态语义路径的时态权重,计算方法如下:
其中,表示当前年份,表示关系属性中的开始时间年份,表示关系属性中的结束时间年份,和表示相同节点对之间不同关系的标号, 表示时态语义路径,表示时态语义路径的标号,和分别为人物对象节点和与邻居节点的构成时态语义路径的关系的时态权重值。
4.根据权利要求1所述的基于异质网络时态语义路径相似度的人物唯一性识别方法,其特征在于,步骤3的具体步骤为:
首先,从图数据库中按照不同类型的关系读取数据;
然后,对每一种类型的异质性关系网络分别进行遍历,依次在每一种类型的异质性关系网络中计算每一对人物对象对和的相似性测度,即,的计算方法如下:
其中, 表示异质社会关系网络中关系类型的标号,根据时态语义路径的起点和终点的不同划分成三种不同类型的时态语义路径的集合、以及,若以上关系具有权重,则、和分别表示时态语义路径、和的权重和。
5.根据权利要求1所述的基于异质网络时态语义路径相似度的人物唯一性识别方法,其特征在于,步骤4的具体步骤为:
对于每一对人物对象节点和,计算其在整个异质网络中的时态语义路径相似度值,即,对每一种类型的关系网络中时态语义路径相似度求算术平均值,如下:
其中,其中表示该异质社会关系网络中关系类型的集合,表示该网络中的一种关系类型,表示异质关系网络中关系种类的数目,计算结果表示人物对象节点和在该异质关系网络中的时态语义路径相似度的值;最后,根据人物对象节点对的值进行排序,并根据当前关系网络特征以及网络分析与挖掘的应用需求设定人物唯一性阈值,用该阈值对整个关系网络中所有人物对象节点对的时态语义路径相似度的计算结果进行过滤,该相似度的取值小于该阈值的人物对象节点即为具有唯一性特征的人物对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310746652.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种专名自动翻译的方法
- 下一篇:互联网段落级话题识别系统





