[发明专利]对消息进行聚类的方法和设备无效
申请号: | 201210030679.X | 申请日: | 2012-02-10 |
公开(公告)号: | CN103246676A | 公开(公告)日: | 2013-08-14 |
发明(设计)人: | 李邵明;张军;钟朝亮;邹纲;松尾昭彦 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 进行 方法 设备 | ||
1.一种对消息进行聚类的方法,包括:
对所述消息进行分词,并分别计算通过分词获得的词的词频作为其权重;
生成与所述消息对应的特征向量,其中,所述特征向量的每个元素分别与所述词相对应,每个元素的值分别为相对应的词的权重;
根据所述词被用户关注的程度和/或包含所述词的消息的数目与全部消息的数目之间的相对比例,调整作为所述特征向量中的元素的值的所述词的权重,使得所述程度和/或比例越高,则所述权重被调整得越高;
计算权重被调整后的特征向量之间的相似度;以及
根据所述相似度将全部消息聚类为分组。
2.根据权利要求1所述的方法,其中:
所述词被用户关注的程度由所述词在关注标签向量中的权重来表示,其中,根据消息的重要度得分和/或用户处理消息的类型,更新所述词在所述关注标签向量中的权重,使得消息的重要度得分越高,则所述词在所述关注标签向量中的权重被更新得越高,与所述类型相对应的系数被应用于更新所述词在所述关注标签向量中的权重。
3.根据权利要求1所述的方法,在对所述消息进行分词的步骤之前,还包括:
收集来自不同来源的消息;以及
分别采用与所述来源对应的转换方式,将所述来自不同来源的消息转换成统一的格式。
4.根据权利要求1所述的方法,还包括:
计算所述分组中的每个消息的重要度得分和/或紧急度得分;
根据所述分组中的每个消息的重要度得分和/或紧急度得分,获得所述分组的重要度得分和/或紧急度得分;以及
根据所述分组的重要度得分和/或紧急度得分,对所述分组进行排序。
5.根据权利要求4所述的方法,还包括:
根据所述分组的重要度得分和/或所述紧急度得分、以及环境因素,选择用于发送相应的分组中的消息的通知方式;
按照预定义的模板,对所述相应的分组中的消息进行渲染以生成通知内容;以及
通过所选择的通知方式将生成的通知内容发送给用户。
6.一种对消息进行聚类的设备,包括:
分词单元,其被配置成对所述消息进行分词,并分别计算通过分词获得的词的词频作为其权重;
向量生成单元,其被配置成生成与所述消息对应的特征向量,其中,所述特征向量的每个元素分别与所述词相对应,每个元素的值分别为相对应的词的权重;
权重调整单元,其被配置成根据所述词被用户关注的程度和/或包含所述词的消息的数目与全部消息的数目之间的相对比例,调整作为所述特征向量中的元素的值的所述词的权重,使得所述程度和/或比例越高,则所述权重被调整得越高;
相似度计算单元,其被配置成计算权重被调整后的特征向量之间的相似度;以及
消息聚类单元,其被配置成根据所述相似度将全部消息聚类为分组。
7.根据权利要求6所述的设备,其中:
所述词被用户关注的程度由所述词在关注标签向量中的权重来表示,其中,根据消息的重要度得分和/或用户处理消息的类型,更新所述词在所述关注标签向量中的权重,使得消息的重要度得分越高,则所述词在所述关注标签向量中的权重被更新得越高,与所述类型相对应的系数被应用于更新所述词在所述关注标签向量中的权重。
8.根据权利要求6所述的设备,还包括:
消息收集单元,其被配置成收集来自不同来源的消息;以及
格式转换单元,其被配置成分别采用与所述来源对应的转换方式,将所述来自不同来源的消息转换成统一的格式。
9.根据权利要求6所述的设备,还包括:
消息得分计算单元,其被配置成计算所述分组中的每个消息的重要度得分和/或紧急度得分;
分组得分计算单元,其被配置成根据所述分组中的每个消息的重要度得分和/或紧急度得分,获得所述分组的重要度得分和/或紧急度得分;以及
分组排序单元,其被配置成根据所述分组的重要度得分和/或紧急度得分,对所述分组进行排序。
10.根据权利要求9所述的设备,还包括:
选择单元,其被配置成根据所述分组的重要度得分和/或紧急度得分、以及环境因素,选择用于发送相应的分组中的消息的通知方式;
渲染单元,其被配置成按照预定义的模板,对所述相应的分组中的消息进行渲染以生成通知内容;以及
发送单元,其被配置成通过所选择的通知方式将生成的通知内容发送给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210030679.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物柴油及其催化还原制备方法
- 下一篇:秸秆燃料柱及其制作方法