[发明专利]信息处理装置和方法、程序及记录介质有效

申请号：	200710162893.X	申请日：	2007-10-22
公开（公告）号：	CN101165779A	公开（公告）日：	2008-04-23
发明（设计）人：	小林由幸	申请（专利权）人：	索尼株式会社
主分类号：	G10L21/00	分类号：	G10L21/00;G10L15/00;G10L15/02
代理公司：	北京东方亿思知识产权代理有限责任公司	代理人：	董方源
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	信息处理装置方法程序记录介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种信息处理装置，包括：

分析装置，用于在预定频带的每个中按时间顺序连续地分析按时间顺序连续的声音数据；

连续特征量提取装置，用于从所述分析装置的分析结果中提取连续特征量，所述连续特征量是按时间顺序连续的特征量；

分割装置，用于将所述连续特征量分割成多个区域，所述多个区域中的每个具有预定的长度；

区域特征量提取装置，用于从所述连续特征量被分割成的多个区域中的每个中提取区域特征量，所述区域特征量是由一个标量或向量表示的特征量；以及

目标特征量评估装置，用于根据所述区域特征量的每个评估目标特征量，所述目标特征量是表示声音数据的一个特征的特征量。

2.如权利要求1所述的信息处理装置，

其中，通过学习由按时间顺序连续的声音数据和表示在所述连续特征量被分割成的多个区域中的每个区域中表示声音数据的一个正确特征的特征量构成的教师数据来预创建所述目标特征量评估装置。

3.如权利要求1所述的信息处理装置，

其中，所述分析装置将按时间顺序连续的声音数据作为每个八音阶的12平均律的音程的声音按时间顺序连续地进行分析，并且

其中，所述连续特征量提取装置从作为所述分析装置的分析结果获得的并且表示每个八音阶的12平均律的音程的能量的数据中提取连续特征量。

4.如权利要求1所述的信息处理装置，

其中，所述目标特征量评估装置评估将音乐或谈话标识为声音数据的特征的目标特征量。

5.如权利要求1所述的信息处理装置，还包括：

平滑装置，用于通过获得目标特征量的滑动平均值来平滑目标特征量。

6.如权利要求1所述的信息处理装置，还包括：

存储装置，用于将标识由所评估的目标特征量表示的特征的标记添加到声音数据，并存储已经添加了标记的声音数据。

7.如权利要求1所述的信息处理装置，还包括：

算法创建装置，用于根据GA(遗传算法)或GP(遗传规划)创建从按时间顺序连续的声音数据中提取连续特征量的算法。

8.一种信息处理方法，包括下面的步骤：

在预定频带的每个中按时间顺序连续地分析按时间顺序连续的声音数据；

从所述分析步骤的分析结果中提取连续特征量，所述连续特征量是按时间顺序连续的特征量；

将所述连续特征量分割成多个区域，所述多个区域中的每个具有预定的长度；

从所述连续特征量被分割成的多个区域中的每个中提取区域特征量，所述区域特征量是由一个标量或向量表示的特征量；以及

根据所述区域特征量的每个评估目标特征量，所述目标特征量是表示声音数据的一个特征的特征量。

9.一种由计算机执行的程序，所述程序包括下面的步骤：

在预定频带的每个中按时间顺序连续地分析按时间顺序连续的声音数据；

从分析步骤的分析结果中提取连续特征量，所述连续特征量是按时间顺序连续的特征量；

将所述连续特征量分割成多个区域，所述多个区域中的每个具有预定的长度；

从所述连续特征量被分割成的多个区域中的每个中提取区域特征量，所述区域特征量是由一个标量或向量表示的特征量；以及

根据所述区域特征量的每个评估目标特征量，所述目标特征量是表示声音数据的一个特征的特征量。

10.一种记录介质，所述记录介质上记录了由计算机执行的程序，所述程序包括下面的步骤：

在预定频带的每个中按时间顺序连续地分析按时间顺序连续的声音数据；

从所述分析步骤的分析结果中提取连续特征量，所述连续特征量是按时间顺序连续的特征量；

将所述连续特征量分割成多个区域，所述多个区域中的每个具有预定的长度；

从所述连续特征量被分割成的多个区域中的每个中提取区域特征量，所述区域特征量是由一个标量或向量表示的特征量；以及

从所述区域特征量的每个中评估目标特征量，所述目标特征量是表示声音数据的一个特征的特征量。

11.一种信息处理装置，包括：

分析部分，所述分析部分在预定频带的每个中按时间顺序连续地分析按时间顺序连续的声音数据；

连续特征量提取部分，所述连续特征量提取部分从所述分析部分的分析结果中提取连续特征量，所述连续特征量是按时间顺序连续的特征量；

分割部分，所述分割部分将所述连续特征量分割成多个区域，所述多个区域中的每个具有预定的长度；

区域特征量提取部分，所述区域特征量提取部分从所述连续特征量被分割成的多个区域中的每个中提取区域特征量，所述区域特征量是由一个标量或向量表示的特征量；以及

目标特征量评估部分，所述目标特征量评估部分根据所述区域特征量的每个评估目标特征量，所述目标特征量是表示声音数据的一个特征的特征量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于索尼株式会社，未经索尼株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710162893.X/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]信息处理装置和方法、程序及记录介质有效

专利文献下载