[发明专利]对消息进行聚类的方法和设备无效
申请号: | 201210030679.X | 申请日: | 2012-02-10 |
公开(公告)号: | CN103246676A | 公开(公告)日: | 2013-08-14 |
发明(设计)人: | 李邵明;张军;钟朝亮;邹纲;松尾昭彦 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 进行 方法 设备 | ||
技术领域
本申请总体上涉及消息处理的领域,尤其涉及对消息进行聚类的方法和设备。
背景技术
近来,出现了各种信息传递方式。例如,在企业内部,常见的信息传递方式例如有IP电话、电子邮件、即时消息、日历表、CRM等;在企业外部,常见的信息传递方式例如有微博、博客等。作为信息来源的这些信息传递方式产生了大量的消息。
由于所产生的消息的量非常大,所以如果对大量的消息中的每条消息分别进行处理,则消息处理的效率相当低。而且,大量的消息会淹没重要的消息,使得难以从大量的消息中获取重要的消息。
发明内容
在下文中将给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本发明的实施例,提供了一种对消息进行聚类的方法,包括:对消息进行分词,并分别计算通过分词获得的词的词频作为其权重;生成与消息对应的特征向量,其中,特征向量的每个元素分别与词相对应,每个元素的值分别为相对应的词的权重;根据词被用户关注的程度和/或包含词的消息的数目与全部消息的数目之间的相对比例,调整作为特征向量中的元素的值的词的权重,使得程度和/或比例越高,则权重被调整得越高;计算权重被调整后的特征向量之间的相似度;以及根据相似度将全部消息聚类为分组。
根据上述对消息进行聚类的方法,其中,词被用户关注的程度由词在关注标签向量中的权重来表示,其中,根据消息的重要度得分和/或用户处理消息的类型,更新词在关注标签向量中的权重,使得消息的重要度得分越高,则词在关注标签向量中的权重被更新得越高,与该类型相对应的系数被应用于更新词在关注标签向量中的权重。
根据上述对消息进行聚类的方法,在对消息进行分词的步骤之前,还包括:收集来自不同来源的消息;以及分别采用与来源对应的转换方式,将来自不同来源的消息转换成统一的格式。
根据上述对消息进行聚类的方法,还包括:计算分组中的每个消息的重要度得分和/或紧急度得分;根据分组中的每个消息的重要度得分和/或紧急度得分,获得分组的重要度得分和/或紧急度得分;以及根据分组的重要度得分和/或紧急度得分,对分组进行排序。
根据上述对消息进行聚类的方法,还包括:根据分组的重要度得分和/或紧急度得分、以及环境因素,选择用于发送相应的分组中的消息的通知方式;按照预定义的模板,对相应的分组中的消息进行渲染以生成通知内容;以及通过所选择的通知方式将生成的通知内容发送给用户。
根据本申请的另一实施例,提供了一种对消息进行聚类的设备,包括:分词单元,其被配置成对消息进行分词,并分别计算通过分词获得的词的词频作为其权重;向量生成单元,其被配置成生成与消息对应的特征向量,其中,特征向量的每个元素分别与词相对应,每个元素的值分别为相对应的词的权重;权重调整单元,其被配置成根据词被用户关注的程度和/或包含词的消息的数目与全部消息的数目之间的相对比例,调整作为特征向量中的元素的值的词的权重,使得程度和/或比例越高,则权重被调整得越高;相似度计算单元,其被配置成计算权重被调整后的特征向量之间的相似度;以及消息聚类单元,其被配置成根据相似度将全部消息聚类为分组。
根据上述对消息进行聚类的设备,其中,词被用户关注的程度由词在关注标签向量中的权重来表示,其中,根据消息的重要度得分和/或根据用户处理消息的类型,更新词在关注标签向量中的权重,使得消息的重要度得分越高,则词在关注标签向量中的权重被更新得越高,与类型相对应的系数被应用于更新词在关注标签向量中的权重。
根据上述对消息进行聚类的设备,还包括:消息收集单元,其被配置成收集来自不同来源的消息;以及格式转换单元,其被配置成分别采用与来源对应的转换方式,将来自不同来源的消息转换成统一的格式。
根据上述对消息进行聚类的设备,还包括:消息得分计算单元,其被配置成计算分组中的每个消息的重要度得分和/或紧急度得分;分组得分计算单元,其被配置成根据分组中的每个消息的重要度得分和/或紧急度得分,获得分组的重要度得分和/或紧急度得分;以及分组排序单元,其被配置成根据分组的重要度得分和/或紧急度得分,对分组进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210030679.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物柴油及其催化还原制备方法
- 下一篇:秸秆燃料柱及其制作方法