[发明专利]语音解码图的构建方法、装置、服务器和存储介质在审
| 申请号: | 201811381481.X | 申请日: | 2018-11-20 |
| 公开(公告)号: | CN109448704A | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 何金来;雷宇 | 申请(专利权)人: | 北京智能管家科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/183;G10L15/26;G10L19/00 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 101500 北京市密云区经济开发*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标点符号 样本语料 静音 解码图 构建 存储介质 样本语音 语音解码 服务器 词语 语音 语音识别文本 语音识别 语音信息 准确度 时长 关联 | ||
1.一种语音解码图的构建方法,其特征在于,包括:
提取样本语料中包括的词语和标点符号;
依据所述样本语料关联的样本语音,确定各类标点符号的静音特征;其中,所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气;
依据所述样本语料中包括的词语和标点符号,以及各类标点符号的静音特征,确定用于语音和标点符号识别的解码图。
2.根据权利要求1所述的方法,其特征在于,所述依据所述样本语料中包括的词语和标点符号,以及各类标点符号的静音特征,确定用于语音和标点符号识别的解码图,包括:
依据各类标点符号的静音特征,将标点符号关联的识别规则标注在包括声学特征与发音音素的映射关系的声学模型中,以及包括发音音素与词语的映射关系的发音词典中;
依据所述样本语料中包括的词语和标点符号训练用于确定词语和标点符号出现概率的语言模型;
依据所述声学模型、所述发音词典和所述语言模型构建所述解码图。
3.根据权利要求2所述的方法,其特征在于,依据各类标点符号的静音特征,将标点符号关联的识别规则标注在声学模型中,包括:
依据各类标点符号的静音特征,归纳静音特征类型;
确定用于标识各类静音特征的静音音素;
将所述静音特征与所述静音音素的映射关系标注在所述声学模型中。
4.根据权利要求3所述的方法,其特征在于,依据各类标点符号的静音特征,将标点符号关联的识别规则标注在发音词典中,包括:
确定各类静音特征关联的至少一个标点符号;
依据静音特征与静音音素的映射关系,将静音音素与所述至少一个标点符号的映射关系标注在所述发音词典中。
5.根据权利要求2所述的方法,其特征在于,依据所述样本语料中包括的词语和标点符号训练语言模型,包括:
依据各词语和各标点符号在样本语料中的出现次数,以及样本语料中的词语总数和标点符号总数,确定各词语的出现概率和各标点符号的出现概率;
依据各词语的出现概率和各标点符号的出现概率,训练所述语言模型。
6.根据权利要求1所述的方法,其特征在于,在所述确定用于语音和标点符号识别的解码图之后,还包括:
采用所述解码图对获取的待识别语音进行语音识别和标点符号添加。
7.根据权利要求6所述的方法,其特征在于,采用所述解码图对获取的待识别语音进行标点符号添加,包括:
提取待识别语音的目标静音特征;
依据解码图的声学模型中静音特征与静音音素的映射关系,确定所述目标静音特征关联的至少一个静音音素;
依据解码图的发音词典中静音音素与标点符号的映射关系,确定所述至少一个静音音素关联的至少一个候选标点符号;
依据解码图的语言模型中所述至少一个候选标点符号的出现概率,确定添加至语音识别文本中的目标标点符号。
8.一种语音解码图的构建装置,其特征在于,包括:
语料处理模块,用于提取样本语料中包括的词语和标点符号;
标点特征确定模块,用于依据所述样本语料关联的样本语音,确定各类标点符号的静音特征;其中,所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气;
解码图构建模块,用于依据所述样本语料中包括的词语和标点符号,以及各类标点符号的静音特征,确定用于语音和标点符号识别的解码图。
9.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的语音解码图的构建方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的语音解码图的构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智能管家科技有限公司,未经北京智能管家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811381481.X/1.html,转载请声明来源钻瓜专利网。





