[发明专利]一种电力语音中多音字检测方法在审
| 申请号: | 202010540515.6 | 申请日: | 2020-06-15 |
| 公开(公告)号: | CN113808580A | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 王治华;高峰;陈宏福 | 申请(专利权)人: | 国网上海市电力公司 |
| 主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L21/0216;G10L25/21 |
| 代理公司: | 武汉江楚智汇知识产权代理事务所(普通合伙) 42228 | 代理人: | 姚宏博 |
| 地址: | 200122 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 电力 语音 多音字 检测 方法 | ||
本发明涉及基于人工智能的电力领域,具体为一种电力语音中多音字检测方法,其不同之处在于,包括以下步骤:步骤1:采集语音内容形成语音信号,进行预处理;步骤2:对每一帧语音信号进行快速傅立叶变换,确定其幅度谱和相位谱,同时确定平均幅度谱输入步骤五;步骤3:确定多窗谱功率谱密度;确定其平滑功率谱密度;步骤4:确定增益因子;步骤5:得到谱减后的幅度谱;步骤6:求出减噪后的语音信号;步骤7:确定对数能量与谱熵的比值即能熵比;步骤8:检测到电力语音起始点;步骤9:检测到语音终止点;步骤10:重复步骤8和步骤9直至电力语音段结束。本发明有效提升电力领域用户在自然环境中多音字识别准确率。
技术领域
本发明涉及基于人工智能的电力领域,具体为一种电力语音中多音字检测方法。
背景技术
多音字就是一个字有多种读音,这是现代汉语的重要特点之一。电力公司为经济社会发展提供安全、经济、清洁、可持续的电力供应和服务,作为电力服务平台,电力调度中会遇到各种多音字问题,形成理解歧义。在端点检测信号处理的过程中,端点检测是一项特别重要的语音处理技术。短时能量、短时过零率、熵谱和倒谱等都是端点检测经常使用的方法。但是这些特征方法仅仅用于参数的优化和提取,忽视了语音增强的辅助性,这会对电力语音检测的结果有一定的影响。比如在高信噪比的环境下,在电力领域可以取得较好的效果。但是,由于电力业务的特殊性,在自然带噪的语音环境中,因信噪比较低,多音字检测效果就会有所降低。
鉴于此,为了克服现有技术缺点,提供一种电力语音中多音字检测方法成为本领域亟待解决的问题。
发明内容
本发明目的在于克服现有技术的缺点,提供一种电力语音中多音字检测方法,有效提升电力领域用户在自然环境中多音字识别准确率。
为解决以上技术问题,本发明提供了一种电力语音中多音字检测方法,其不同之处在于,包括以下步骤:
步骤1:采集电力领域自然场景下语音内容形成语音信号,并对所述语音信号进行预处理;
步骤2:对每一帧语音信号进行快速傅立叶变换,确定其幅度谱和相位谱,同时确定平均幅度谱输入步骤五;
步骤3:对步骤1加窗分帧处理后的语音信号进行多窗谱估计,确定多窗谱功率谱密度;然后做相邻帧的平滑处理,并且确定其平滑功率谱密度;
步骤4:根据静音段估计噪声,根据步骤3确定平均功率谱密度值,通过谱减关系来确定增益因子;
步骤5:通过步骤4和步骤2得到的增益因子和平均幅度谱,得到谱减后的幅度谱;
步骤6:根据步骤5的谱减后的幅度谱和相位谱进行快速傅立叶逆变换,将频域还原到时域,然后求出减噪后的语音信号;
步骤7:通过步骤6确定减噪后的语音信号的对数能量和每个电力语音帧的短时谱熵,然后确定对数能量与谱熵的比值即能熵比;
步骤8:根据步骤7得到的能熵比进行判断,设置高阈值,如果当前电力语音帧的能熵比高于阈值时确定为电力语音段的起始点;如果当前电力语音帧的能熵比不高于阈值时,则取下一段电力语音帧的能熵比与阈值比较,重复步骤8,直到检测到电力语音起始点;
步骤9:根据步骤8检测到电力语音的起始点后,设置低阈值,如果当前电力语音帧的能熵比低于阈值时确定为电力语音段的终止点;如果当前电力语音帧的能熵比不低于阈值时,则取下一段电力语音帧的能熵比与阈值比较,重复步骤9,直到检测到语音终止点;
步骤10:重复步骤8和步骤9直至电力语音段结束。
按以上技术方案,所述步骤1中的预处理包括分帧处理和加窗处理。
按以上技术方案,预处理后的语音信号的相邻帧之间有重叠。
按以上技术方案,所述步骤3中,多窗谱功率谱密度的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司,未经国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010540515.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种叶酸甜菜碱复合粉及其制备方法
- 下一篇:教导机器人的安全系统及方法





