[发明专利]语音解码图的构建方法、装置、服务器和存储介质在审
| 申请号: | 201811381481.X | 申请日: | 2018-11-20 |
| 公开(公告)号: | CN109448704A | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 何金来;雷宇 | 申请(专利权)人: | 北京智能管家科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/183;G10L15/26;G10L19/00 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 101500 北京市密云区经济开发*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标点符号 样本语料 静音 解码图 构建 存储介质 样本语音 语音解码 服务器 词语 语音 语音识别文本 语音识别 语音信息 准确度 时长 关联 | ||
本发明实施例公开了一种语音解码图的构建方法、装置、服务器和存储介质。该方法包括:提取样本语料中包括的词语和标点符号;依据所述样本语料关联的样本语音,确定各类标点符号的静音特征;其中,所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气;依据所述样本语料中包括的词语和标点符号,以及各类标点符号的静音特征,确定用于语音和标点符号识别的解码图。本发明实施例通过基于带有规范性标点符号的样本语料进行解码图的构建,获得能够识别语音中标点符号的解码图,实现了在语音识别中为语音识别文本添加标点符号,提高标点符号添加的准确度,从而提高了语音信息和情感的真实传达效果。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种语音解码图的构建方法、装置、服务器和存储介质。
背景技术
随着语音识别技术的快速发展,生活中的各个领域逐渐采用语音识别技术进行事务的快速处理,例如会议的记录或人机交互等。为了避免语音信息的理解产生歧义,因此对语音识别结果中添加标点符号对于语音信息的理解以及识别文本的呈现起着至关重要的作用。
现有技术中,为了对语音识别结果中添加标点符号,通常需要用户在口授期间讲出相应的标点符号,通过语音识别词语中的标点符号并转换为文本的标点符号,以此增强识别文本的识别效果和语音信息的理解效果。但是在某些场景中并不能要求用户口授标点符号,因此现有技术通常还会只在语音停顿或结尾的位置添加逗号或句号。
然而,现有技术在语音识别结果中添加标点符号的方式单一,准确度较低,难以真实传递语音信息和所表达的情感。
发明内容
本发明实施例提供了一种语音解码图的构建方法、装置、服务器和存储介质,能够构建识别语音中标点符号的解码图,提高语音识别中标点符号的识别准确度。
第一方面,本发明实施例提供了一种语音解码图的构建方法,包括:
提取样本语料中包括的词语和标点符号;
依据所述样本语料关联的样本语音,确定各类标点符号的静音特征;其中,所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气;
依据所述样本语料中包括的词语和标点符号,以及各类标点符号的静音特征,确定用于语音和标点符号识别的解码图。
第二方面,本发明实施例提供了一种语音解码图的构建装置,包括:
语料处理模块,用于提取样本语料中包括的词语和标点符号;
标点特征确定模块,用于依据所述样本语料关联的样本语音,确定各类标点符号的静音特征;其中,所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气;
解码图构建模块,用于依据所述样本语料中包括的词语和标点符号,以及各类标点符号的静音特征,确定用于语音和标点符号识别的解码图。
第三方面,本发明实施例提供了一种服务器,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的语音解码图的构建方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的语音解码图的构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智能管家科技有限公司,未经北京智能管家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811381481.X/2.html,转载请声明来源钻瓜专利网。





