[发明专利]一种基于音频特征参数的多语种场景分析方法在审
| 申请号: | 201810962497.3 | 申请日: | 2018-08-22 |
| 公开(公告)号: | CN109036458A | 公开(公告)日: | 2018-12-18 |
| 发明(设计)人: | 龙华;周金傲;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/45;G10L25/51;G10L25/18;G10L17/26;G10L17/00;G10L15/02;G10L15/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于音频特征参数的多语种场景分析方法,属于音频信号处理技术领域。针对多段不同内容的样本,对各种语种进行语音信号录制,分别对每个语种进行相同时间的录制,时间一定,录制软件为GoldWave,格式为Wav,录制后得到每种语种的多段对比语音信号;先进行A/D转换,然后预加重处理,再进行分帧处理,最后对语音信号进行加窗函数处理;用时域分析方法提取待测的多语种音频信号信息的时域特征参数;用频域分析方法提取待测的多语种音频信号信息的频域特征参数;用倒谱分析方法提取待测的多语种音频信号信息的倒谱特征参数;利用提取的各个语种的特征量,分析各语种之间的差异,进行多语种的场景分析和判别。 | ||
| 搜索关键词: | 多语种 语种 音频信号信息 场景分析 方法提取 音频特征参数 语音信号 多段 录制 音频信号处理 语音信号录制 倒谱分析 加窗函数 录制软件 频域分析 频域特征 时域特征 特征参数 特征量 预加重 分帧 用时 样本 分析 | ||
【主权项】:
1.一种基于音频特征参数的多语种场景分析方法,其特征在于:(1)录制样本:针对多段不同内容的样本,对各种语种进行语音信号录制,分别对每个语种进行相同时间的录制,时间一定,录制软件为GoldWave,格式为Wav,录制后得到每种语种的多段对比语音信号;(2)预处理:先进行A/D转换,然后预加重处理,再进行分帧处理,最后对语音信号进行加窗函数处理;(3)提取特征参数:用时域分析方法提取待测的多语种音频信号信息的时域特征参数;用频域分析方法提取待测的多语种音频信号信息的频域特征参数;用倒谱分析方法提取待测的多语种音频信号信息的倒谱特征参数;(4)利用提取的各个语种的特征量,分析各语种之间的差异,进行多语种的场景分析和判别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810962497.3/,转载请声明来源钻瓜专利网。





