[发明专利]用于网络消息通信的联系人语义分组方法有效

专利信息
申请号: 201110346312.4 申请日: 2011-11-04
公开(公告)号: CN102347917A 公开(公告)日: 2012-02-08
发明(设计)人: 黄健斌;孙鹤立;李伟;吴志殿;慕鹏;赵贝贝;雷倩 申请(专利权)人: 西安电子科技大学
主分类号: H04L12/58 分类号: H04L12/58;H04L12/24;G06F17/30
代理公司: 陕西电子工业专利中心 61205 代理人: 王品华;朱红星
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 网络 消息 通信 联系人 语义 分组 方法
【说明书】:

技术领域

发明属于网络通信技术领域,涉及网络用户通信数据和行为分析技术,具体是一种用于网络消息通信的联系人语义分组方法。针对网络邮件、手机通话、即时消息通信、社交网络等网络消息通信系统,提供用户联系人的自动分组管理支持。

背景技术

随着信息时代的到来,当前许多领域都面临着对海量数据的处理,而如何在海量的数据中提取有用的信息已成为当前研究的主要方向。尤其随着个人的通讯方式越来越多,其历史通信数据广泛存在于手机、电子邮箱、即时消息、飞信、社交网络等网络通信系统的客户端上,并且个人在社会的角色是多样的,人与人之间的交互导致了嵌套和重叠的语义群组结构的产生,嵌套群组结构可以展现用户好友社会关系的不同层次,这些在现实生活中很常见,例如:一个用户的同学群组又可分为高中同学、大学同学和研究生同学等子群组。重叠群组则允许一个联系人可以属于多个群组,这也是合理的。例如:一个用户的某个同学可能又是他目前的同事,这些都使个人的历史通信数据变的复杂而海量,在学术领域这类数据通常都可以建模为包含实体和实体之间关系的图。因此如何从图数据中发现有意义的联系人语义分组是一个具有挑战性的问题,具有重要的理论意义和实用价值。

现在学术界针对联系人语义分组这个问题已经有了很深入的研究,提出了很多相关的方法。在数据挖掘领域已经提出了很多分组聚类方法,例如:基于层次的聚类、密度聚类、网格聚类等。基于层次的聚类方法是对给定的数据集进行层次的分解,直到某种条件满足为止;密度聚类是只要一个区域中的点的密度大过某个阈值,就把它加到与之相近的聚类中;网格聚类是采用多维网格数据结构,将空间划分为优先数目的单元,以构成一个可以进行聚类分析的网络结构。而这些传统的图聚类方法通常针对大规模数据集,采用全局化的批量数据处理方法,导致其效率较低,运行时间较长和存储空间开销较大,对于单个用户的历史消息通信数据,其所处理得到的联系人语义分组难以满足现实要求。

发明内容

本发明的目的在于针对上述已有技术的不足,提出一种用于网络消息通信的联系人语义分组方法,以减小联系人语义分组的运行时间和存储空间开销,使消息通信系统更便利和人性化,满足用户的现实要求。

实现本发明的技术思路是:通过对用户局部通信链接图数据进行分析,构建由语义群组构成的拓扑关系,然后对拓扑关系用Jaccard系数进行合并,实现消息通信的联系人语义分组。具体步骤包括如下:

(A)构建用户消息通信社会关系图,即在用户的一次通信记录中,先将用户自身看作是一个节点u,然后将其余所有联系人的集合看作是另一个节点l,在用户节点u和联系人节点l之间建立一条边,以此方式遍历所有通信数据,得到用户的消息通信社会关系图;

(B)构建由语义群组构成的拓扑关系T:

B1)初始化拓扑关系T,在用户消息通信社会关系图中,抽取出那些与用户节点u通信相对频繁的节点作为语义群组,即一个通信记录的联系人的数目大于等于最小组规模时,将联系人集合所构成的节点作为一个语义群组加入到拓扑关系T中;

B2)生成候选语义群组的最大子集,即如果任意两个语义群组的交集也满足最小组规模时,则将其交集也加入到T中,直到没有新的群组加入为止;

B3)去除无意义的群组,即将用户节点u与语义群组g交互的消息个数小于最小消息计数阈值的的候选语义群组移除;

B4)将不相关的语义群组合并,即通过计算语义群组间共享差serr进行识别归入,将拓扑关系T中的语义群组按照规模大小进行降序排序,迭代地遍历语义群组集合,移除那些可被更大规模群组代替的语义群组;

(C)构建层次化的语义群组:

C1)对步骤B4)阶段产生的语义群组,计算任意两个语义群组g1和g2间的Jaccard系数,是语义群组g1和g2具有的相同联系人构成的集合

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110346312.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top