[发明专利]对消息进行聚类的方法和设备无效

专利信息
申请号: 201210030679.X 申请日: 2012-02-10
公开(公告)号: CN103246676A 公开(公告)日: 2013-08-14
发明(设计)人: 李邵明;张军;钟朝亮;邹纲;松尾昭彦 申请(专利权)人: 富士通株式会社
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 杜诚;李春晖
地址: 日本神*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 消息 进行 方法 设备
【说明书】:

技术领域

本申请总体上涉及消息处理的领域,尤其涉及对消息进行聚类的方法和设备。

背景技术

近来,出现了各种信息传递方式。例如,在企业内部,常见的信息传递方式例如有IP电话、电子邮件、即时消息、日历表、CRM等;在企业外部,常见的信息传递方式例如有微博、博客等。作为信息来源的这些信息传递方式产生了大量的消息。

由于所产生的消息的量非常大,所以如果对大量的消息中的每条消息分别进行处理,则消息处理的效率相当低。而且,大量的消息会淹没重要的消息,使得难以从大量的消息中获取重要的消息。

发明内容

在下文中将给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

根据本发明的实施例,提供了一种对消息进行聚类的方法,包括:对消息进行分词,并分别计算通过分词获得的词的词频作为其权重;生成与消息对应的特征向量,其中,特征向量的每个元素分别与词相对应,每个元素的值分别为相对应的词的权重;根据词被用户关注的程度和/或包含词的消息的数目与全部消息的数目之间的相对比例,调整作为特征向量中的元素的值的词的权重,使得程度和/或比例越高,则权重被调整得越高;计算权重被调整后的特征向量之间的相似度;以及根据相似度将全部消息聚类为分组。

根据上述对消息进行聚类的方法,其中,词被用户关注的程度由词在关注标签向量中的权重来表示,其中,根据消息的重要度得分和/或用户处理消息的类型,更新词在关注标签向量中的权重,使得消息的重要度得分越高,则词在关注标签向量中的权重被更新得越高,与该类型相对应的系数被应用于更新词在关注标签向量中的权重。

根据上述对消息进行聚类的方法,在对消息进行分词的步骤之前,还包括:收集来自不同来源的消息;以及分别采用与来源对应的转换方式,将来自不同来源的消息转换成统一的格式。

根据上述对消息进行聚类的方法,还包括:计算分组中的每个消息的重要度得分和/或紧急度得分;根据分组中的每个消息的重要度得分和/或紧急度得分,获得分组的重要度得分和/或紧急度得分;以及根据分组的重要度得分和/或紧急度得分,对分组进行排序。

根据上述对消息进行聚类的方法,还包括:根据分组的重要度得分和/或紧急度得分、以及环境因素,选择用于发送相应的分组中的消息的通知方式;按照预定义的模板,对相应的分组中的消息进行渲染以生成通知内容;以及通过所选择的通知方式将生成的通知内容发送给用户。

根据本申请的另一实施例,提供了一种对消息进行聚类的设备,包括:分词单元,其被配置成对消息进行分词,并分别计算通过分词获得的词的词频作为其权重;向量生成单元,其被配置成生成与消息对应的特征向量,其中,特征向量的每个元素分别与词相对应,每个元素的值分别为相对应的词的权重;权重调整单元,其被配置成根据词被用户关注的程度和/或包含词的消息的数目与全部消息的数目之间的相对比例,调整作为特征向量中的元素的值的词的权重,使得程度和/或比例越高,则权重被调整得越高;相似度计算单元,其被配置成计算权重被调整后的特征向量之间的相似度;以及消息聚类单元,其被配置成根据相似度将全部消息聚类为分组。

根据上述对消息进行聚类的设备,其中,词被用户关注的程度由词在关注标签向量中的权重来表示,其中,根据消息的重要度得分和/或根据用户处理消息的类型,更新词在关注标签向量中的权重,使得消息的重要度得分越高,则词在关注标签向量中的权重被更新得越高,与类型相对应的系数被应用于更新词在关注标签向量中的权重。

根据上述对消息进行聚类的设备,还包括:消息收集单元,其被配置成收集来自不同来源的消息;以及格式转换单元,其被配置成分别采用与来源对应的转换方式,将来自不同来源的消息转换成统一的格式。

根据上述对消息进行聚类的设备,还包括:消息得分计算单元,其被配置成计算分组中的每个消息的重要度得分和/或紧急度得分;分组得分计算单元,其被配置成根据分组中的每个消息的重要度得分和/或紧急度得分,获得分组的重要度得分和/或紧急度得分;以及分组排序单元,其被配置成根据分组的重要度得分和/或紧急度得分,对分组进行排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210030679.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top