[发明专利]带情感的音频生成方法、装置、设备及存储介质在审
| 申请号: | 202210643661.0 | 申请日: | 2022-06-09 |
| 公开(公告)号: | CN114937447A | 公开(公告)日: | 2022-08-23 |
| 发明(设计)人: | 唐向阳;蔡卓君 | 申请(专利权)人: | 深圳市大头兄弟科技有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/63;G10L13/08 |
| 代理公司: | 深圳市特讯知识产权代理事务所(普通合伙) 44653 | 代理人: | 孟智广 |
| 地址: | 518000 广东省深圳市宝安区西乡街道劳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情感 音频 生成 方法 装置 设备 存储 介质 | ||
1.一种带情感的音频生成方法,其特征在于,包括步骤:
接收多个带情感标签的语音数据,生成情感语音集;
接收待转换的文字字符串,对所述文字字符串进行分句处理,得到N个短句字符和短句排序,其中,N为正整数;
根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签;
基于所述短句字符对应的情感标签,对所述情感语音集进行标签匹配处理,得到情感标签匹配的情感语音;
基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频;
根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频;
其中,所述根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签包括:
对所述短句字符进行顺序拆分处理,得到M个语言字符和字符排序,其中,M为正整数;
根据预置字符向量表,对所述语言字符进行向量转换处理,得到字符向量;
基于所述字符排序,将M个所述字符向量进行拼接处理,得到短语拼接矩阵;
根据预置整体赋值算法,对所述短语拼接矩阵进行维度赋值处理,得到短语赋值矩阵;
根据预置分类算法,对所述短语赋值矩阵进行分类处理,得到所述短句字符对应的情感标签。
2.根据权利要求1所述的带情感的音频生成方法,其特征在于,所述根据预置整体赋值算法,对所述短语拼接矩阵进行维度赋值处理,得到短语赋值矩阵包括:
读取所述短语拼接矩阵的短语拼接元素,计算所述短语拼接元素与相邻元素之间的欧式距离,得到前元素距离和后元素距离;
分析所述前元素距离与预置距离阈值的大小关系,分析所述后元素距离与预置距离阈值的大小关系;
将超过所述距离阈值的距离对应元素划分为非关联元素,将未超过所述距离阈值的距离对应元素划分为关联元素;
基于预置关联区分算法,对所述短语拼接矩阵中关联元素进行区分赋值处理,得到短语赋值矩阵。
3.根据权利要求1所述的带情感的音频生成方法,其特征在于,所述根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频包括:
创建音频框架;
基于所述短句排序,按序读取N个所述短句音频的每一帧数据,得到帧序列数据集;
将所述帧序列数据集写入至所述音频框架中,生成所述文字字符串对应的文字情感音频。
4.根据权利要求1所述的带情感的音频生成方法,其特征在于,所述基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频包括:
根据预置采样框,对所述情感标签匹配的情感语音进行切分采样处理,得到音频特征集;
基于所述音频特征集,对所述短句字符进行声纹模拟处理,得到短句音频。
5.根据权利要求1-4任一项所述的带情感的音频生成方法,其特征在于,所述情感标签包括:开心标签、悲伤标签、生气标签、惊讶标签、平和标签。
6.根据权利要求5所述的带情感的音频生成方法,其特征在于,在所述根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频之后,还包括:
基于所述情感标签,对所述文字情感音频进行片段标记处理,得到带有多个情感标记的文字情感音频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大头兄弟科技有限公司,未经深圳市大头兄弟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210643661.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于移动的园林种植箱
- 下一篇:一种Micro LED芯片及其制作方法





