[发明专利]一种基于音频特征参数的多语种场景分析方法在审
| 申请号: | 201810962497.3 | 申请日: | 2018-08-22 |
| 公开(公告)号: | CN109036458A | 公开(公告)日: | 2018-12-18 |
| 发明(设计)人: | 龙华;周金傲;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/45;G10L25/51;G10L25/18;G10L17/26;G10L17/00;G10L15/02;G10L15/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多语种 语种 音频信号信息 场景分析 方法提取 音频特征参数 语音信号 多段 录制 音频信号处理 语音信号录制 倒谱分析 加窗函数 录制软件 频域分析 频域特征 时域特征 特征参数 特征量 预加重 分帧 用时 样本 分析 | ||
本发明涉及一种基于音频特征参数的多语种场景分析方法,属于音频信号处理技术领域。针对多段不同内容的样本,对各种语种进行语音信号录制,分别对每个语种进行相同时间的录制,时间一定,录制软件为GoldWave,格式为Wav,录制后得到每种语种的多段对比语音信号;先进行A/D转换,然后预加重处理,再进行分帧处理,最后对语音信号进行加窗函数处理;用时域分析方法提取待测的多语种音频信号信息的时域特征参数;用频域分析方法提取待测的多语种音频信号信息的频域特征参数;用倒谱分析方法提取待测的多语种音频信号信息的倒谱特征参数;利用提取的各个语种的特征量,分析各语种之间的差异,进行多语种的场景分析和判别。
技术领域
本发明涉及一种基于音频特征参数的多语种场景分析方法,属于音频信号处理技术领域。
背景技术
随着时代的进步,世界的发展,各国的交流越来越频繁,语言是阻碍每个国家之间交流的重要原因,因此对于各国多语种的语音识别显得尤为重要,每种语言都有它们的特点,利用改进的音频提取方法可以更好将它们分类,得到它们各自的特征参数,进而实现多语种的场景分析。
发明内容
本发明要解决的技术问题是提供一种基于音频特征参数的多语种场景分析方法,对多个语种进行音频特征参数的提取,并对不同特征参数计算的结果进行分类总结,得出不同语种的特点和差异。
本发明的技术方案是:一种基于音频特征参数的多语种场景分析方法:
(1)录制样本:针对多段不同内容的样本,对各种语种进行语音信号录制,分别对每个语种进行相同时间的录制,时间一定,录制软件为GoldWave,格式为Wav,录制后得到每种语种的多段对比语音信号;
(2)预处理:先进行A/D转换,然后预加重处理,再进行分帧处理,最后对语音信号进行加窗函数处理;
(3)提取特征参数:用时域分析方法提取待测的多语种音频信号信息的时域特征参数;用频域分析方法提取待测的多语种音频信号信息的频域特征参数;用倒谱分析方法提取待测的多语种音频信号信息的倒谱特征参数;然后对提取到的参数进行时域特征分析,如若可以得出差异,则频域分析和倒谱分析就不再有必要;如若不能得出差异,则对语音样本进行频域分析;如若还不能得出差异,则对语音样本进行倒谱分析。提取顺序为时域分析、频域分析、倒谱分析。
把音频信号进行时域、频域、倒谱分析后,两两对比,分别比对两个语种信号之间特征参数的差异。
(4)利用提取的各个语种的特征量,分析各语种之间的差异,进行多语种的场景分析和判别。
所述预处理包括四个步骤:A/D转换、预加重处理、分帧处理、加窗函数;
(1)A/D转换:将数字信号转化为模拟信号;
AD转换就是模数转换,把模拟信号转换成数字信,经过A/D转换,得出数字信号,得到更有益于我们分析和参数提取的信号样本。
(2)预加重处理:将语音信号通过一个高通滤波器,采用数字电路的方式提升语音中的高频部分,得到利于频谱处理的信号样本。
(3)分帧处理:将信号分为较短的帧,视为可被处理的稳态信号,令帧与帧之间有帧移,取帧长的1/2。
利用语音信号的短时分析将信号分割成若干个语音段,一段为一帧,每段在10-30ms,让帧与帧之间有部分重叠,使帧与帧之间平滑过渡,得到重叠的部分为帧移,取帧长的1/2。
语音信号是个准稳态信号,把它分成较短的帧,将其看成稳态信号,用处理稳态信号的方法去处理。
(4)加窗函数:对分帧过的语音样本进行加窗函数处理,得到的每一帧语音乘以汉明窗或海宁窗。减弱了频域中的泄漏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810962497.3/2.html,转载请声明来源钻瓜专利网。





