[发明专利]一种中英文混合语音识别方法在审

申请号：	202010948079.6	申请日：	2020-09-10
公开（公告）号：	CN112037762A	公开（公告）日：	2020-12-04
发明（设计）人：	朱羿孜;许召辉;马翼平;陈年生;范光宇;饶蕾;周圣杰	申请（专利权）人：	中航华东光电（上海）有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/04;G10L15/08;G10L15/26
代理公司：	上海乐泓专利代理事务所(普通合伙) 31385	代理人：	张雪
地址：	201114 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种中英文混合语音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种中英文混合语音识别方法，其特征在于：采集中英文混合语音后，将语音按照一定的帧长划分为若干段语音信号，且分段重叠率为40％，对分段后的语音信号进行高通滤波，滤波后进行加窗处理，得到每段语音信号的加窗函数，并计算判断是否为静音段，对非静音段的语音信号进行中文识别判断，当识别成功则输出该段中文且设定语种标识为1，当识别失败设定语种标识为0并进行英文识别，将识别成功则输出该段英文且更新语种标识为0，，识别失败则设定语种标识为1重新进行中文识别。

2.根据权利要求1所述的一种中英文混合语音识别方法，其特征在于：将语音按照一定的帧长划分为若干段语音信号具体为按一定的帧长L划分为N语音段，控制帧长，使每段语音尽量只包含一个字，分段重叠率为40％，每一段的语音信号记为x_a(n)。

3.根据权利要求1所述的一种中英文混合语音识别方法，其特征在于：所述加窗处理具体为通过以下公式(1)和公式(2)进行计算

y_a(n)＝x_a(n)*w(n) (2)；

其中，w(n)为窗函数，n为语音帧数。

计算得到加窗函数y_a(n)。

4.根据权利要求3所述的一种中英文混合语音识别方法，其特征在于：判断语音信号是否为静音段具体为通过公式(3)和公式(4)计算各语音段的短时能量E(a)与过零率Z(a)的值，并将短时能量E(a)与过零率Z(a)进行加权，权值分别为k₁、k₂，加权判断函数H(a)的计算公式(5)并设置阈值H_set，若H(a)≥H_set为语音段，若H(a)H_set则该段为静音段；

H(a)＝k₁E(a)+k₂Z(a) (5)

其中，阈值H_set为10，权值k₁、k₂分别为

5.根据权利要求4所述的一种中英文混合语音识别方法，其特征在于：对每段语音信号进行判断是否为静音段，若两段语音段间包含静音段，则将静音段舍去，两段语音段不处理，视为两个单字或单词；若两段语音段之间不包含静音段，则将两段语音段组合，视为一个语音段，视为一个字或单词。

6.根据权利要求5所述的一种中英文混合语音识别方法，其特征在于：进行中文识别具体为将非静音段的语音信号与中文库数据库进行匹配，所述中文库数据库包含基本生活常用单字(词)，不包含英文派生的中文同音字(词)，当匹配成功则输出该段中文且设定语种标识为1；若匹配失败，则将不匹配的语音段与该语音段前后语音段组合进行中文识别，匹配成功，则输出该段中文且设定语种标识为1，匹配失败，设定语种标识为0进行英文识别。

7.根据权利要求6所述的一种中英文混合语音识别方法，其特征在于：进行英文识别具体为对语种标识为0的语音信号与英文数据库进行匹配，其中英文数据库包含基本生活常用单词，不包含中文派生的英文同音字(词)，当匹配成功，则输出该段英文且设定语种标识为0；若匹配失败，则将不匹配的语音段与该语音段前后语音段组合后进行英文识别，若匹配成功，则输出该段英文且设定语种标识为0，若匹配失败时设定语种标识为1继续判断。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中航华东光电（上海）有限公司，未经中航华东光电（上海）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010948079.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种环形切割大口径钢管的激光切割装置
下一篇：一种具有割板冷却并能保养激光头的激光切割机

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种中英文混合语音识别方法在审

专利文献下载