[发明专利]确定在文档中所表达的情绪的系统和方法无效
申请号: | 201080064703.0 | 申请日: | 2010-12-23 |
公开(公告)号: | CN102812475A | 公开(公告)日: | 2012-12-05 |
发明(设计)人: | M.杜昂-范 | 申请(专利权)人: | 梅塔瓦纳股份有限公司 |
主分类号: | G06K9/72 | 分类号: | G06K9/72 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 于小宁 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 文档 表达 情绪 系统 方法 | ||
相关申请的交叉引用
本申请要求2010年12月23日提交的题为“System And Method for Determining Sentiment Expressed in Documents”的美国专利申请第12/977,513号的优先权。本申请还要求2009年12月24日提交的题为“Sentiment Platform”的美国临时专利申请第61/284,820号的优先权。本申请还要求2009年12月24日提交的题为“Mobile Sentiment Platform”的美国临时专利申请第61/284,819号的优先权。本申请还要求2010年10月15日提交的题为“Sentiment Engine”的美国临时专利申请第61/393,813号的优先权。通过引用,将这四个申请每个全文并入于此。
技术领域
所公开的实施例一般地涉及确定在文档中所表达的情绪。。
背景技术
因特网包括关于各种主题的信息。该信息可能由特定领域的专家或者临时用户(例如,博主、评论员等等)撰写。搜索引擎允许用户识别包括关于用户感兴趣的主题的信息的文档。然而,目前难以识别这些用户所表达的关于特定主题(例如,特定宾馆的房间质量)的情绪。
附图说明
图1是示出根据一些实施例的网络的框图。
图2是示出根据一些实施例的情绪服务器的框图。
图3是根据一些实施例的确定在文档中所表达的情绪的方法的流程图。
图4是根据一些实施例的提取关键词列表的方法的流程图。
图5是根据一些实施例的生成类别列表的方法的流程图。
图6是根据一些实施例的生成类别列表的另一方法的流程图。
图7是根据一些实施例的确定与句子的至少一个关键词对应的至少一个类别的另一方法的流程图。
图8是根据一些实施例的确定类别的类别谱的方法的流程图。
图9是根据一些实施例的从文档集中选择多个文档的方法的流程图。
图10是根据一些实施例的机器的框图。
在附图中,相似参考标号指代对应的部分。
具体实施方式
以下描述包括体现示例性实施例的示例性系统、方法、技术、指令序列、以及计算机程序产品。在以下描述中,为了说明的目的,提出了很多具体细节以便提供对于本发明主题的各种实施例的理解。然而,对于本领域技术人员而言明显的是:本发明主题的实施例可以在没有这些具体细节的情况下实践。总的来说,没有详细示出公知的指令实例、协议、结构和技术。
这里描述的实施例提供了确定在文档中所表达的情绪的技术。
图1是示出根据一些实施例的网络120的框图。网络120通常可以包括能够将计算节点耦接到一起的任何类型的有线或无线通信通道。这包括但不限于局域网、广域网、或网络组合。在一些实施例中,网络120包括因特网。
在一些实施例中,服务器100耦接到网络120。服务器100可以包括文档102。文档102可以是任何类型的文档,包括但不限于web文档(例如,超文本标记语言(HTML)文档、可扩展标记语言(XML)文档等)、文本文档、电子数据表(spreadsheet)、报告书(presentation)、扫描文档(例如,扫描文本等)、图像等等。
在一些实施例中,聚集器104耦接到网络120。聚集器104可以包括文档106。在一些实施例中,聚集器104从服务器100获得文档102的至少一个子集。例如,聚集器104可以爬行(crawl)服务器100,并且从服务器100取回文档102的至少一个子集。
在一些实施例中,情绪服务器108耦接到网络120。情绪服务器108被配置来确定在文档中所表达的情绪,如这里所描述的。情绪服务器108所使用的文档可以包括从服务器100(例如,通过爬行服务器100)获得的文档、从聚集器104(例如,通过从聚集器104购买文档)获得的文档或者其组合。
图2是示出根据一些实施例的情绪服务器108的框图。情绪服务器108包括:情绪模块202,被配置来确定在文档中所表达的情绪;爬行模块204(可选的),被配置来爬行服务器100以获得文档102的至少一个子集;关键词模块206,被配置来从文档中提取关键词;过滤模块208,被配置来过滤关键词和文档;以及分类模块210,被配置来分类文档、句子、和/或关键词。注意,可以组合这些模块的功能。例如,情绪模块202可以包括关键词模块206和过滤模块208的功能。下面关于图3-9更详细地描述这些模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梅塔瓦纳股份有限公司,未经梅塔瓦纳股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080064703.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:含有噁唑酰草胺和恶草酮的除草剂组合物
- 下一篇:人工培育地龙蛆虫的工艺