[发明专利]语音处理方法、装置、电子设备及存储介质有效
申请号: | 202010429062.X | 申请日: | 2020-05-20 |
公开(公告)号: | CN111339786B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 林炳怀;王丽园 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/205;G10L15/22;G10L15/26 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 韩绍君 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 电子设备 存储 介质 | ||
1.一种语音处理方法,其特征在于,所述方法包括:
将待识别语音转换为对应的文本;
将所述文本进行分词处理得到多个分词文本;获取所述多个分词文本分别对应的第二特征向量表示;对所述第二特征向量表示进行多层变换得到所述多个分词文本分别对应的第一特征向量表示;
基于所述第一特征向量表示以及对应的变化规则,得到所述文本的不流利表示以及标点特征表示,所述变化规则包括所述第一特征向量表示与所述不流利表示以及标点特征表示之间的对应关系;
获取每个所述分词文本的不流利表示与所有分词文本的标点特征表示之间的第一相似度,并根据所述第一相似度确定每个所述分词文本对应的新的不流利表示;
获取每个所述分词文本的标点特征表示与所有分词文本的不流利表示之间的第二相似度,并根据所述第二相似度确定每个所述分词文本对应的新的标点特征表示;
基于所述新的不流利表示和所述新的标点特征表示得到不流利检测结果以及标点标注结果。
2.根据权利要求1所述的方法,其特征在于,所述获取每个所述分词文本的不流利表示与所有分词文本的标点特征表示之间的第一相似度,并根据所述第一相似度确定每个所述分词文本对应的新的不流利表示,包括:
获取每个所述分词文本的所述不流利表示分别与每个分词文本的所述标点特征表示的相似度,作为所述第一相似度;
将所述第一相似度作为权重,与所有分词文本的标点特征表示进行加权求和,得到每个所述分词文本对应的全局标点特征表示;
将每个所述分词文本的所述不流利表示与各自对应的所述全局标点特征表示进行拼接,得到每个所述分词文本对应的新的不流利表示。
3.根据权利要求1所述的方法,其特征在于,所述获取每个所述分词文本的标点特征表示与所有分词文本的不流利表示之间的第二相似度,并根据所述第二相似度确定每个所述分词文本对应的新的标点特征表示,包括:
获取每个所述分词文本的所述标点特征表示分别与每个分词文本的不流利表示的相似度,作为所述第二相似度;
将所述第二相似度作为权重,与所有分词文本的不流利表示进行加权求和,得到每个所述分词文本对应的全局不流利表示;
将每个所述分词文本的所述标点特征表示与各自对应的所述全局不流利表示进行拼接,得到每个所述分词文本对应的新的标点特征表示。
4.根据权利要求1-3任一所述的方法,其特征在于,所述将待识别语音转换为对应的文本,包括:响应于客户端发送的语音识别指令,将所述客户端发送的待识别语音转换为对应的文本;
所述基于所述新的不流利表示和所述新的标点特征表示得到不流利检测结果以及标点标注结果之后还包括:
基于所述不流利检测结果以及标点标注结果对所述文本进行不流利标注以及标点标注,得到标注后的文本;
将所述标注后的文本返回给所述客户端,以使所述客户端显示所述标注后的文本。
5.根据权利要求1-3任一所述的方法,其特征在于,所述将待识别语音转换为对应的文本,包括:响应于客户端发送的语音评分指令,将所述客户端发送的待识别语音转换为对应的文本;
所述基于所述新的不流利表示和所述新的标点特征表示得到不流利检测结果以及标点标注结果之后还包括:
基于所述不流利检测结果去除所述文本中的不流利的文本分词,并基于所述标点标注结果对所述文本进行标点标注,得到待评分的文本;
基于所述待评分的文本进行语音评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010429062.X/1.html,转载请声明来源钻瓜专利网。