[发明专利]一种应用于移动终端的语音情感识别方法在审
| 申请号: | 201410218988.9 | 申请日: | 2014-05-22 |
| 公开(公告)号: | CN104036776A | 公开(公告)日: | 2014-09-10 |
| 发明(设计)人: | 毛峡;阿尔伯托·罗贝塔;陈立江;安东尼奥·托特拉;彭一平;马修·都德斯卡都;保罗·马尔切利尼 | 申请(专利权)人: | 毛峡;阿尔伯托·罗贝塔 |
| 主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L25/63;H04M1/725 |
| 代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 周长琪 |
| 地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 应用于 移动 终端 语音 情感 识别 方法 | ||
1.一种用于移动计算平台的语音情感识别的方法;以说话人无关和说话人相关两种方式处
理语音信息,识别说话人当前通过语音表达的主要情感,包括以下步骤:
a)录制情感语音数据库,作为情感识别器的基准;
b)建立和训练说话人无关识别器,并构建多层识别器模型;
c)建立和训练说话人相关识别器,以情感语音数据库或用户个性化信息作为基准,校正识别器内部参数;
d)获取用户语音数据;
e)对该用户的语音数据进行分析,判断该语音数据是否能被说话人相关识别器处理,若是,则使用说话人相关识别器进行情感识别,并进行步骤g);若否,则进行步骤f);
f)使用说话人无关识别器进行情感识别;
g)得到情感识别结果。
2.如权利要求1所述的方法,录制情感语音数据库的步骤包括:
1)输入预定的录音脚本;
2)记录录音环境的信息;
3)根据录音脚本的要求,获取语音数据;
4)对语音数据作可用性判别,将适用数据收录进数据库;
5)对每条数据作情感类别划分,并进行标定;
6)重复步骤3)至5),直至获取情感语音数据库的全部语音数据。
3.如权利要求1所述的方法,说话人无关识别器的建立和训练过程如下:
1)提取情感语音数据库中语音数据的特征信息;
2)选取特定的特征组合,构成特征集;
3)对特征集进行特征降维,得到训练集;
4)由多个情感分类器建立说话人无关情感识别器,该情感识别器为多层结构,每一层将语音信号的情感类别进行逐层细分;
5)使用上述训练集训练情感识别器。
4.如权利要求1所述的方法,说话人相关识别器的建立和训练过程如下:
1)获取数据库中的语音数据对应的个人信息;
2)根据该个人信息,构建个性化情感模型,建立情感识别器;
3)根据数据库中的语音数据校准情感识别器内部参数,训练情感识别器。
5.如权利要求1所述的方法,在步骤d)与步骤e)之间,包括如下步骤:
1)获取用户周围的环境信息,自动调整情感识别器的参数;
2)对所获取的语音数据进行降噪处理及针对所述环境信息的优化处理。
6.如权利要求2所述的方法,记录录音环境的信息包括环境温度,湿度,噪声水平,亮度。
7.如权利要求3所述的方法,特征信息包括:能量,过零率,基频,共振峰,频谱质心,截断频率,自相关密度,分形维数,Mel倒谱系数。
8.如权利要求4所述的方法,个人信息包括:性别,年龄,职业,国籍。
9.如权利要求1-8任意之一所述的方法,可用于:
智能设备,该设备可感知用户以语音所表达的情感,进而改变该智能设备的行为逻辑,
使用户通过语音情感控制该智能设备;或
自动报警设备,该设备可感知语音中危险情感,并实时传输至监控中心;或
医疗设备,协同医用电子系统监控患者的情绪状态,并实时显示、监控、处理并存储患者的情感数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于毛峡;阿尔伯托·罗贝塔,未经毛峡;阿尔伯托·罗贝塔许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410218988.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种野外勘探用的录音笔
- 下一篇:钥匙管理箱和钥匙管理系统





