[发明专利]语音解码图的构建方法、装置、服务器和存储介质在审

申请号：	201811381481.X	申请日：	2018-11-20
公开（公告）号：	CN109448704A	公开（公告）日：	2019-03-08
发明（设计）人：	何金来;雷宇	申请（专利权）人：	北京智能管家科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/183;G10L15/26;G10L19/00
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	101500 北京市密云区经济开发***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	标点符号样本语料静音解码图构建存储介质样本语音语音解码服务器词语语音语音识别文本语音识别语音信息准确度时长关联
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种语音解码图的构建方法、装置、服务器和存储介质。该方法包括：提取样本语料中包括的词语和标点符号；依据所述样本语料关联的样本语音，确定各类标点符号的静音特征；其中，所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气；依据所述样本语料中包括的词语和标点符号，以及各类标点符号的静音特征，确定用于语音和标点符号识别的解码图。本发明实施例通过基于带有规范性标点符号的样本语料进行解码图的构建，获得能够识别语音中标点符号的解码图，实现了在语音识别中为语音识别文本添加标点符号，提高标点符号添加的准确度，从而提高了语音信息和情感的真实传达效果。

技术领域

本发明实施例涉及语音识别技术领域，尤其涉及一种语音解码图的构建方法、装置、服务器和存储介质。

背景技术

随着语音识别技术的快速发展，生活中的各个领域逐渐采用语音识别技术进行事务的快速处理，例如会议的记录或人机交互等。为了避免语音信息的理解产生歧义，因此对语音识别结果中添加标点符号对于语音信息的理解以及识别文本的呈现起着至关重要的作用。

现有技术中，为了对语音识别结果中添加标点符号，通常需要用户在口授期间讲出相应的标点符号，通过语音识别词语中的标点符号并转换为文本的标点符号，以此增强识别文本的识别效果和语音信息的理解效果。但是在某些场景中并不能要求用户口授标点符号，因此现有技术通常还会只在语音停顿或结尾的位置添加逗号或句号。

然而，现有技术在语音识别结果中添加标点符号的方式单一，准确度较低，难以真实传递语音信息和所表达的情感。

发明内容

本发明实施例提供了一种语音解码图的构建方法、装置、服务器和存储介质，能够构建识别语音中标点符号的解码图，提高语音识别中标点符号的识别准确度。

第一方面，本发明实施例提供了一种语音解码图的构建方法，包括：

提取样本语料中包括的词语和标点符号；

依据所述样本语料关联的样本语音，确定各类标点符号的静音特征；其中，所述静音特征至少包括各类标点符号在样本语音中的静音时长或表达语气；

依据所述样本语料中包括的词语和标点符号，以及各类标点符号的静音特征，确定用于语音和标点符号识别的解码图。