[发明专利]微博概括无效

专利信息
申请号: 201210453572.6 申请日: 2012-11-13
公开(公告)号: CN102982124A 公开(公告)日: 2013-03-20
发明(设计)人: 安妮·路易斯;托德·纽曼 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 郎晓虹;李春晖
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 概括
【说明书】:

技术领域

本公开涉及可应用于博客或微博以便以缩短的形式呈现被判定为有用的信息的概括技术。

背景技术

许多公众意见通过万维网(World Wide Web)来表达。常常,这些意见在所谓的博客或微博中表达。博客(网络日志(web log)的缩写)通常用来提供评论、事件描述或诸如图片或视频等其他材料。微博是博客形式的广播媒体,并且与传统博客的区别在于:其内容在实际和总计的文件大小二者上通常更小。

博客或者微博通常能够包含许多信息。这些信息能够让许多不同的个人感兴趣。然而,因为博客和微博的庞大数量,这些信息可能经常被混淆或者完全地丢失。

发明内容

提供本发明内容是为了以简化形式来介绍选择的概念,下面在具体实施方式中会进一步描述选择的概念。本发明内容并非旨在标识所要求保护的主题的关键特征或必要特征。

各实施例提供了可应用于博客或微博的以缩短的形式来呈现确定为有用的信息的概括技术。在一个或更多个实施例中,一种方法被用来从诸如免费文本等各种资源中来自动获取一组概念。这些所获取的概念然后用来指导聚类处理。通过合并情感和词的频率,簇被排名并且随后被概括。

附图说明

参考附图对具体实施方式进行描述。图中,附图标记最左边的数字标识该附图标记首次出现的图。在说明书和附图中的不同实例中使用相同附图标记可表示相似或相同项。

图1示出根据一个或更多个实施例的示例性实施方式的环境。

图2更详细地示出图1所示的示例性实施方式的系统。

图3示出了根据一个或更多个实施例的示例性学习组件。

图4示出了根据一个或更多个实施例的示例性上位词树(hypernymtree)。

图5示出了根据一个或更多个实施例的示例性概括组件。

图6为描述根据一个或更多个实施例的方法中的步骤的流程图。

图7示出了可用来实施这里描述的各实施例的示例性计算装置。

具体实施方式

概述

各实施例提供了可用于博客或微博的以缩短形式呈现被确定为有用的信息的概括技术。该技术可用于博客或任意大小的博客类型的入口。在至少一些实施例中,该技术可用于通常具有1000个或更少的字符的入口。在至少一些实施例中,该技术可用于具有140个或更少的字符的微博。这包括可以只有几个句子长的微博。这样的微博的一个示例叫做“推特(tweets)”。该概括技术可用于广泛的入口类型。

在一个或更多个实施例中,一种方法用来从诸如免费文本等各种资源中来自动获取一组概念。然后,这些所获取的概念用来指导聚类处理。通过合并情感和词的频率,簇被排名并且随后被概括。

为了说明该概括技术,利用了与公司相关的微博形式的入口类型。这些微博通常提及公司名称,并且可以包含与所提及的公司相关的意见的表达。经常,这些微博并不是有意的评论并且可包括从关于新闻文章的讨论到与特定公司相关的职位招聘和广告等各种观点。这使得自动判断微博中表达的情感更加困难。在该情况下,各种方法被用来获取一组商业概念,该商业概念然后被用于指导聚类处理(clustering process),其中,簇(cluster)被排名并被概括。

在下述讨论中,首先描述可操作地使用这里描述的技术的示例性环境。然后描述可在该示例性环境以及其他环境中使用的各实施例的示例说明。相应地,该示例性环境并不限于执行所描述的实施例并且所描述的实施例也不限于在该示例性环境中实施。

示例性运行环境

图1所示为可操作地使用本文档描述的技术的示例性实施方式中的环境100。所图示的环境100包括可以以多种方法配置的计算装置102的示例。比如,计算装置102可配置为例如关于图2而进一步描述的传统计算机(比如台式个人计算机和笔记本计算机等)、移动站、娱乐装置、通信地耦合到电视机的机顶盒、无线电话、上网本(netbook)、游戏控制台和手持装置等。因此,计算装置102可以涉及从具有实质的存储器和处理器资源的完整资源装置(比如个人电脑、游戏操作台)到具有有限的存储器和/或处理资源的低资源装置(比如传统置顶盒、手持游戏控制台)。计算装置102也包括使计算装置102执行下面描述的一个或更多个操作的软件。

计算装置102包括学习组件103和概括组件104。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210453572.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top