[发明专利]用于改善社交媒体数据的方法和系统有效
申请号: | 201410474908.6 | 申请日: | 2014-09-17 |
公开(公告)号: | CN104462173B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | S.M.M.M.阿里;O.A.D.A.艾拉巴蒂;H.E.埃尔施什尼;S.萨布里 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎;黄剑飞 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体内容 过滤数据 媒体数据 社交网络 数据类别 重复数据 分析 | ||
1.一种改善来自多个社交网络供给的社交媒体数据的方法,包括:
聚集从所述多个社交网络供给接收的社交媒体内容;
通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据;
分析所述过滤数据用于确定至少一个数据类别;以及
基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要,
其中,所述通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据包含:
检测所述多个社交网络供给内的多个相似的供给;
利用包含有实体的多个拼写变化形式和已知名称的元数据库,将所述多个相似的供给聚集在单一条目中,其中,将多个不同单一实体记载映射到唯一性标识符;
将所述多个拼写变化形式和已知名称内的每个拼写变化形式和每个已知名称替换为被映射到的唯一性标识符;
将被映射到的唯一性标识符附加到与所述多个相似的供给内的每个供给相关联的元数据。
2.根据权利要求1所述的方法,还包括:
生成一组用户定义的偏好,其中在分析所述过滤数据期间基于应用所述用户定义的偏好来确定所述至少一个数据类别;以及
将所述一组用户定义的偏好添加到偏好资料数据库。
3.根据权利要求2所述的方法,其中所述用户定义的偏好包括包含传送格式的传送偏好。
4.根据权利要求1所述的方法,其中所述消除重复数据包括:
从所接收的聚集社交媒体内容中合并或删除重复数据。
5.根据权利要求1所述的方法,其中所述生成所述过滤数据包括利用偏好资料数据库和实体资料数据库。
6.根据权利要求1所述的方法,其中所述至少一个数据类别包括永久类别和临时类别中至少一个并且通过包含用户标识、时间戳以及具有狭窄间隔的地理-标签的元数据来识别。
7.根据权利要求1所述的方法,其中所述摘要的呈现包括利用数据尺寸、数据类型以及数据类别中的至少一个。
8.根据权利要求6所述的方法,其中所述临时类别包括对包含传送内容和传送格式的一组用户定义的偏好的临时改变。
9.一种用于改善来自多个社交网络供给的社交媒体数据的计算机系统,包括:
一个或多个处理器、一个或多个计算机可读内存、一个或多个计算机可读有形存储器件以及存储在所述一个或多个存储器件中的至少一个上用于经由所述一个或多个计算机可读内存的至少一个由所述由所述一个或多个处理器的至少一个执行的程序指令,其中所述计算机系统能够执行一种方法,该方法包括:
聚集从所述多个社交网络供给接收的社交媒体内容;
通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据;
分析所述过滤数据用于确定至少一个数据类别;以及
基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要,
其中,所述通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据包含:
检测所述多个社交网络供给内的多个相似的供给;
利用包含有实体的多个拼写变化形式和已知名称的元数据库,将所述多个相似的供给聚集在单一条目中,其中,将多个不同单一实体记载映射到唯一性标识符;
将所述多个拼写变化形式和已知名称内的每个拼写变化形式和每个已知名称替换为被映射到的唯一性标识符;
将被映射到的唯一性标识符附加到与所述多个相似的供给内的每个供给相关联的元数据。
10.根据权利要求9所述的计算机系统,还包括:
生成一组用户定义的偏好,其中在分析所述过滤数据期间基于应用所述用户定义的偏好来确定所述至少一个数据类别;以及
将所述一组用户定义的偏好添加到偏好资料数据库。
11.根据权利要求10所述的计算机系统,其中所述用户定义的偏好包括包含传送格式的传送偏好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410474908.6/1.html,转载请声明来源钻瓜专利网。