[发明专利]信息处理装置和方法在审
申请号: | 201610921729.1 | 申请日: | 2016-10-21 |
公开(公告)号: | CN107977352A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 孟遥;陈大军;张波 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 唐京桥,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 | ||
技术领域
本公开涉及信息处理的技术领域,具体地涉及情绪词分类的装置和方法。
背景技术
这个部分提供了与本公开有关的背景信息,这不一定是现有技术。
随着人工智能技术的不断发展,情感计算在人机交互中扮演着越来越重要的作用。传统的情绪识别任务主要基于情绪词典、规则等方法,对情绪词典的依赖较大。这既导致了覆盖范围的限制又耗费了更多的时间。
发明内容
这个部分提供了本公开的一般概要,而不是其全部范围或其全部特征的全面披露。
本公开的目的在于提供一种信息处理装置和信息处理方法,其有效地将词向量降维并归一化到固定维数,继而获得归一化的词向量特征。
根据本公开的一方面,提供了一种信息处理装置,该装置包括:语料获取单元,其获取来自因特网的文本语料,其中所述文本语料包括训练语料以及未标注语料;词向量训练单元,其针对所述训练语料训练词向量,其中每个词的词向量为k维;词向量降维单元,其对所述训练语料中的每个句子的所有词的词向量组成的矩阵进行降维;以及归一化单元,其对降维的矩阵进行归一化处理,以获得归一化的词向量特征。
根据本公开的另一方面,提供了一种信息处理方法,该方法包括:获取来自因特网的文本语料,其中所述文本语料包括训练语料以及未标注语料;针对所述训练语料训练词向量,其中每个词的词向量为k维;对所述训练语料中的每个句子的所有词的词向量组成的矩阵进行降维;以及对降维的矩阵进行归一化处理,以获得归一化的词向量特征。
根据本公开的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本公开的信息处理方法。
根据本公开的另一方面,提供了一种机器可读存储介质,其上携带有根据本公开的程序产品。
使用根据本公开的信息处理装置和方法,对训练语料中的每个句子的所有词的词向量组成的矩阵进行降维并且对降维的矩阵进行归一化处理,从而获得归一化的词向量特征。由此,根据本公开的信息处理装置和方法可以有效地将词向量降维并归一化到固定维数,以获得归一化的词向量特征,从而有利于情绪词的分类。
从在此提供的描述中,进一步的适用性区域将会变得明显。这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本公开的范围。
附图说明
在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本公开的范围。在附图中:
图1为根据本公开的实施例的信息处理装置的框图;
图2a至图2c示意性示出词向量特征结构;
图3为根据本公开的另一实施例的信息处理装置的框图;
图4示意性示出种子情绪词典中的一部分;
图5示意性示出词向量与字向量特征形式;
图6为根据本公开的实施例的信息处理装置的一部分的框图;
图7为根据本公开的又一实施例的信息处理装置的框图;
图8为根据本公开的实施例的信息处理方法的流程图;以及
图9为其中可以实现根据本公开的实施例的信息处理装置和方法的通用个人计算机的示例性结构的框图。
虽然本公开容易经受各种修改和替换形式,但是其特定实施例已作为例子在附图中示出,并且在此详细描述。然而应当理解的是,在此对特定实施例的描述并不打算将本公开限制到公开的具体形式,而是相反地,本公开目的是要覆盖落在本公开的精神和范围之内的所有修改、等效和替换。要注意的是,贯穿几个附图,相应的标号指示相应的部件。
具体实施方式
现在参考附图来更加充分地描述本公开的例子。以下描述实质上只是示例性的,而不旨在限制本公开、应用或用途。
提供了示例实施例,以便本公开将会变得详尽,并且将会向本领域技术人员充分地传达其范围。阐述了众多的特定细节如特定部件、装置和方法的例子,以提供对本公开的实施例的详尽理解。对于本领域技术人员而言将会明显的是,不需要使用特定的细节,示例实施例可以用许多不同的形式来实施,它们都不应当被解释为限制本公开的范围。在某些示例实施例中,没有详细地描述众所周知的过程、众所周知的结构和众所周知的技术。
使用本公开的技术方案,可以有效地将词向量降维并归一化到固定维数,以获得归一化的词向量特征,从而有利于情绪词的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610921729.1/2.html,转载请声明来源钻瓜专利网。