[发明专利]一种语谱图的生成方法、装置、电子设备及存储介质有效
申请号: | 202110093432.1 | 申请日: | 2021-01-25 |
公开(公告)号: | CN112420072B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 曹岩岗;王黎明 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G10L25/21 | 分类号: | G10L25/21;G10L25/51 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语谱图 生成 方法 装置 电子设备 存储 介质 | ||
1.一种语谱图的生成方法,其特征在于,所述生成方法包括:
基于待处理语音片段中包括的语音样点的数量,确定所述待处理语音片段对应的第一帧移;
采用与所述第一帧移的大小相匹配的调整方式,对所述待处理语音片段对应的初始帧数进行调整,得到调整后的目标帧数;
基于所述待处理语音片段对应的帧长以及第二帧移,将所述待处理语音片段中包括的语音样点划分至对应的语音样点集合中;其中,所述第二帧移为所述第一帧移取整后的值;所述语音样点集合的数量等于所述目标帧数;
针对每个语音样点集合,根据该语音样点集合内每个语音样点的初始振幅,确定该语音样点集合对应的功率谱;
基于各个语音样点集合分别对应的功率谱,生成所述待处理语音片段的语谱图。
2.根据权利要求1所述的语谱图的生成方法,其特征在于,所述基于待处理语音片段中包括的语音样点的数量,确定所述待处理语音片段对应的第一帧移,包括:
根据所述待处理语音片段中包括的语音样点的数量,以及所述待处理语音片段对应的帧长和初始帧数,确定所述第一帧移。
3.根据权利要求1所述的语谱图的生成方法,其特征在于,所述采用与所述第一帧移的大小相匹配的调整方式,对所述待处理语音片段对应的初始帧数进行调整,得到调整后的目标帧数,包括:
若所述第一帧移大于等于第一阈值,则将所述初始帧数确定为所述目标帧数;
若所述第一帧移大于等于第二阈值,并且小于所述第一阈值,则将所述第一帧移更新为预设的特定帧移,并根据所述待处理语音片段中包括的语音样点的数量、所述帧长以及所述特定帧移确定所述目标帧数;其中,所述特定帧移为所述第一阈值;
若所述第一帧移小于所述第二阈值,则将预设的特定帧数确定为所述目标帧数,其中,所述特定帧数为1帧。
4.根据权利要求1所述的语谱图的生成方法,其特征在于,所述针对每个语音样点集合,根据该语音样点集合内每个语音样点的初始振幅,确定该语音样点集合对应的功率谱,包括:
针对每个语音样点集合,根据该语音样点集合内每个语音样点的初始振幅,以及该语音样点对应的窗函数,确定该语音样点的加窗后的目标振幅;
根据预设的快速傅里叶变换点数,每个语音样点集合中包括的各个语音样点分别对应的目标振幅,生成第一序列;其中,所述第一序列内的数值的个数与所述快速傅里叶变换点数相一致,并且所述第一序列内的数值包括各个语音样点分别对应的目标振幅,以及零值;
对每个语音样点集合对应的第一序列内的数值进行傅里叶变换处理,得到该语音样点集合对应的多个傅里叶变换后的复数值;
根据每个语音样点集合对应的多个傅里叶变换后的复数值,确定该语音样点集合对应的功率谱。
5.根据权利要求1所述的语谱图的生成方法,其特征在于,所述基于各个语音样点集合分别对应的功率谱,生成所述待处理语音片段的语谱图,包括:
基于所述初始帧数与所述目标帧数之间的数量关系,以及各个语音样点集合分别对应的功率谱,确定包含初始帧数个功率谱的第二序列;
基于所述包含初始帧数个功率谱的第二序列,生成所述待处理语音片段的语谱图。
6.根据权利要求5所述的语谱图的生成方法,其特征在于,所述基于所述包含初始帧数个功率谱的第二序列,生成所述待处理语音片段的语谱图,包括:
基于预设的功率谱与颜色的对应关系,确定所述第二序列中每个功率谱对应的颜色;
基于所述第二序列中每个功率谱对应的颜色,生成所述待处理语音片段的语谱图;其中,所述语谱图为包含不同颜色的图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110093432.1/1.html,转载请声明来源钻瓜专利网。