[发明专利]基于中英文混合词典的语音识别方法及装置有效
申请号: | 201710309321.3 | 申请日: | 2017-05-04 |
公开(公告)号: | CN107301860B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 李先刚;张雪薇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 中英文 混合 词典 语音 识别 方法 装置 | ||
1.一种基于中英文混合词典的语音识别方法,其特征在于,包括:
获取国际音标IPA标注的中英文混合词典,所述中英文混合词典包括:中文词典和经过中式英语修正的英文词典;
将所述中英文混合词典作为训练词典,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以音节或词为目标,以联结主义时间分类器CTC为训练准则对所述模型进行训练,得到训练后的CTC声学模型;
结合训练后的CTC声学模型对中英文混合语言进行语音识别;
所述将所述中英文混合词典作为训练词典,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以音节或词为目标,以联结主义时间分类器CTC为训练准则对所述模型进行训练,得到训练后的CTC声学模型,包括:
采用滤波器组FBANK提取中式英语句子中的特征点,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以中式英语句子对应的对齐文件为目标,以交叉熵CE为训练准则,对所述模型进行训练,得到初始模型;所述中式英语句子为,既包括汉字又包括英文单词的句子;所述对齐文件包括:中式英语句子中每个音素的位置,以及英文单词所对应的音素;
将所述中英文混合词典作为训练词典,以所述初始模型为模型,以音节或词为目标,以联结主义时间分类器CTC为训练准则对所述初始模型进行训练,得到训练后的CTC声学模型。
2.根据权利要求1所述的方法,其特征在于,所述获取国际音标IPA标注的中英文混合词典,包括:
获取国际音标IPA标注的中文词典以及IPA标注的英文词典;
获取音频训练数据,所述音频训练数据中包括:多个中式英语句子;
获取所述中式英语句子中的英文单词以及英文单词对应的中式发音;
将所述英文单词以及英文单词对应的中式发音添加到所述英文词典中,得到经过中式英语修正的英文词典。
3.根据权利要求1所述的方法,其特征在于,所述获取国际音标IPA标注的中英文混合词典,包括:
获取国际音标IPA标注的中文词典以及IPA标注的英文词典;
获取音频训练数据,所述音频训练数据中包括:多个中式英语句子;
结合IPA标注的英文词典对所述中式英语句子进行音素解码以及对齐文件切分,得到所述中式英语句子中的英文单词以及英文单词对应的中式发音;
结合所述中式英语句子中的英文单词、英文单词对应的中式发音以及IPA标注的英文词典,生成经过中式英语修正的英文词典。
4.根据权利要求3所述的方法,其特征在于,所述结合IPA标注的英文词典对所述中式英语句子进行音素解码以及对齐文件切分,得到所述中式英语句子中的英文单词以及英文单词对应的中式发音,包括:
结合IPA标注的英文词典对所述中式英语句子进行音素解码,找到解码中的最优路径,获取所述中式英语句子中音素对应的帧位置;
获取所述中式英语句子对应的对齐文件,所述对齐文件中包括:中式英语句子中每个音素的位置,以及英文单词所对应的音素;
结合所述对齐文件以及所述中式英语句子中音素对应的帧位置,确定所述中式英语句子中每个英文单词的位置,进行切分,得到所述中式英语句子中的英文单词以及英文单词对应的中式发音。
5.根据权利要求3或4所述的方法,其特征在于,结合所述中式英语句子中的英文单词、英文单词对应的中式发音以及IPA标注的英文词典,生成经过中式英语修正的英文词典之前,还包括:
针对所述中式英语句子中的每个英文单词,获取所述英文单词中每个音素的词频;
获取对应的词频大于预设词频的高频音素以及包括所述高频音素的高频英文单词;
结合所述中式英语句子中的英文单词、英文单词对应的中式发音以及IPA标注的英文词典,生成经过中式英语修正的英文词典,包括:
结合所述中式英语句子中的高频英文单词、高频英文单词对应的中式发音以及IPA标注的英文词典,生成经过中式英语修正的英文词典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710309321.3/1.html,转载请声明来源钻瓜专利网。