[发明专利]一种电力语音中多音字检测方法在审

专利信息
申请号: 202010540515.6 申请日: 2020-06-15
公开(公告)号: CN113808580A 公开(公告)日: 2021-12-17
发明(设计)人: 王治华;高峰;陈宏福 申请(专利权)人: 国网上海市电力公司
主分类号: G10L15/05 分类号: G10L15/05;G10L21/0216;G10L25/21
代理公司: 武汉江楚智汇知识产权代理事务所(普通合伙) 42228 代理人: 姚宏博
地址: 200122 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电力 语音 多音字 检测 方法
【权利要求书】:

1.一种电力语音中多音字检测方法,其特征在于,包括以下步骤:

步骤1:采集电力领域自然场景下语音内容形成语音信号,并对所述语音信号进行预处理;

步骤2:对每一帧语音信号进行快速傅立叶变换,确定其幅度谱和相位谱,同时确定平均幅度谱输入步骤五;

步骤3:对步骤1加窗分帧处理后的语音信号进行多窗谱估计,确定多窗谱功率谱密度;然后做相邻帧的平滑处理,并且确定其平滑功率谱密度;

步骤4:根据静音段估计噪声,根据步骤3确定平均功率谱密度值,通过谱减关系来确定增益因子;

步骤5:通过步骤4和步骤2得到的增益因子和平均幅度谱,得到谱减后的幅度谱;

步骤6:根据步骤5的谱减后的幅度谱和相位谱进行快速傅立叶逆变换,将频域还原到时域,然后求出减噪后的语音信号;

步骤7:通过步骤6确定减噪后的语音信号的对数能量和每个电力语音帧的短时谱熵,然后确定对数能量与谱熵的比值即能熵比;

步骤8:根据步骤7得到的能熵比进行判断,设置高阈值,如果当前电力语音帧的能熵比高于阈值时确定为电力语音段的起始点;如果当前电力语音帧的能熵比不高于阈值时,则取下一段电力语音帧的能熵比与阈值比较,重复步骤8,直到检测到电力语音起始点;

步骤9:根据步骤8检测到电力语音的起始点后,设置低阈值,如果当前电力语音帧的能熵比低于阈值时确定为电力语音段的终止点;如果当前电力语音帧的能熵比不低于阈值时,则取下一段电力语音帧的能熵比与阈值比较,重复步骤9,直到检测到语音终止点;

步骤10:重复步骤8和步骤9直至电力语音段结束。

2.根据权利要求1所述的电力语音中多音字检测方法,其特征在于:所述步骤1中的预处理包括分帧处理和加窗处理。

3.根据权利要求2所述的电力语音中多音字检测方法,其特征在于:预处理后的语音信号的相邻帧之间有重叠。

4.根据权利要求1所述的电力语音中多音字检测方法,其特征在于:所述步骤3中,多窗谱功率谱密度的计算公式为:

P(k,i)=PMTM[xi(m)]

其中i表示第i帧,k表示第k条谱线,PMTM表示进行多窗谱功率谱密度估计。

5.根据权利要求4所述的电力语音中多音字检测方法,其特征在于:所述步骤3中,平滑功率谱密度的计算公式为:

其中,以i帧为中心前后各取M帧,共有2M+1帧进行平均。

6.根据权利要求5所述的电力语音中多音字检测方法,其特征在于:所述步骤4中,根据步骤3得到的平滑功率谱密度确定平均功率谱密度值,其计算公式为:

7.根据权利要求6所述的电力语音中多音字检测方法,其特征在于:所述步骤4中,增益因子的计算公式为:

其中,α为过减因子,β为补偿增益因子。

8.根据权利要求7所述的电力语音中多音字检测方法,其特征在于:所述过减因子α的取值范围为α1,所述补偿增益因子β的取值范围为0β1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司,未经国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010540515.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top