[发明专利]确定在文档中所表达的情绪的系统和方法无效

专利信息
申请号: 201080064703.0 申请日: 2010-12-23
公开(公告)号: CN102812475A 公开(公告)日: 2012-12-05
发明(设计)人: M.杜昂-范 申请(专利权)人: 梅塔瓦纳股份有限公司
主分类号: G06K9/72 分类号: G06K9/72
代理公司: 北京市柳沈律师事务所 11105 代理人: 于小宁
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 确定 文档 表达 情绪 系统 方法
【权利要求书】:

1.一种确定在文档中所表达的情绪的计算机实现的方法,包括:

接收来自多个文档的文档;

使用至少一个处理器,识别文档中的、包括在来自关键词列表的至少一个关键词的预定距离内的至少一个情绪签名的句子,其中,关键词列表是从所述多个文档中提取的,并且使用相转变公式对关键词列表进行过滤,并且其中,所述至少一个情绪签名对应于该句子中的至少一个情绪的表达;

确定与该句子的所述至少一个关键词对应的至少一个类别,其中,所述至少一个类别被包括在类别列表中,该类别列表是使用关键词列表而生成的;以及

基于所述至少一个情绪签名来确定与所述至少一个类别对应的至少一个情绪。

2.如权利要求1所述的计算机实现的方法,其中,在识别文档中的、包括在所述至少一个关键词的预定距离内的至少一个情绪签名的句子之前,该方法还包括通过以下操作来提取关键词列表:

从所述多个文档中的每个文档中提取关键词;

对于每个关键词,

计算该关键词在所述多个文档中的频率f以及包括该关键词的文档的数量N;

使用相转变公式,基于该关键词在所述多个文档中的频率以及包括该关键词的文档的数量来计算关键词的相关性;以及

当该关键词的相关性超过预定阈值时,将该关键词添加到关键词列表。

3.如权利要求2所述的计算机实现的方法,其中,相转变公式为f/Nx,其中x≥1。

4.如权利要求3所述的计算机实现的方法,其中,x为3。

5.如权利要求1所述的计算机实现的方法,其中,在确定与句子的至少一个关键词对应的至少一个类别之前,该方法还包括通过以下操作来生成类别列表:

识别所述多个文档中包括来自关键词列表的至少一个关键词的文档的第一集合;

识别在文档的第一集合中至少预定数量的文档中包括的关键词的集合;以及

将该关键词的集合添加到类别列表,其中,相应的类别包括相应的关键词的集合。

6.如权利要求1所述的计算机实现的方法,其中,在确定与句子的至少一个关键词对应的至少一个类别之前,该方法还包括通过以下操作来生成类别列表:

确定关键词列表中彼此相关的关键词对,其中所述关键词对是独一无二的关键词对;

识别关键词对的集合,其中,每个集合包括对于该集合中的所有关键词对公共的至少一个关键词;以及

迭代地组合关键词对的集合,直至达到预定的终止条件为止,其中,每个组合的集合包括对于该组合的集合中的所有关键词对公共的至少一个关键词。

7.如权利要求1所述的计算机实现的方法,其中,确定与句子的至少一个关键词对应的至少一个类别包括:使用支持向量机来确定与该句子的至少一个关键词对应的至少一个类别。

8.如权利要求1所述的计算机实现的方法,其中,确定与句子的至少一个关键词对应的至少一个类别包括:使用神经网络来确定与该句子的至少一个关键词对应的至少一个类别

9.如权利要求1所述的计算机实现的方法,其中,确定与句子的至少一个关键词对应的至少一个类别包括:

获得多个类别谱,相应的类别谱包括关键词在与相应类别对应的关键词列表中出现的频率;

基于所述至少一个关键词确定该句子的类别谱;

计算该句子的类别谱与所述多个类别谱中的每个类别谱的标量积;以及

将所述至少一个类别确定为与超过预定阈值的至少一个标量积对应的类别。

10.如权利要求9所述的计算机实现的方法,其中,在获得多个类别谱之前,该方法还包括:对于每个类别,通过以下操作确定该类别的类别谱:

获得与该类别对应的文档集;

从该文档集中的每个文档提取关键词;

使用相转变公式过滤关键词,以产生过滤后的关键词;

确定过滤后的关键词在该文档集中出现的频率;以及

将过滤后的关键词的出现频率标准化,以便产生该类别的类别谱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梅塔瓦纳股份有限公司,未经梅塔瓦纳股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080064703.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top