[发明专利]一种将语音转换为文字的方法、装置及系统在审
申请号: | 201711386363.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN109949813A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 王群 | 申请(专利权)人: | 北京君林科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100107 北京市朝阳区天朗*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征参数 目标特征参数 准确率 校验 匹配度 语音转换 目标语音信号 语音数据库 装置及系统 突出显示 预设 匹配 输出 保证 发现 | ||
1.一种将语音转换为文字的方法,其特征在于,包括:
提取目标语音信号的第一特征参数;
将第二特征参数与语音数据库中的第三特征参数进行匹配,确定N个目标特征参数,所述N个目标特征参数是所述第三特征参数中与所述第二特征参数匹配度最大的N个,N≥2,所述第二特征参数为所述第一特征参数中的一部分;
确定与所述第二特征参数匹配度最大的一个目标特征参数对应的文字,并输出所述文字;
利用所述N个目标特征参数的匹配度确定所述文字的准确率;
如果所述准确率低于预设阈值,对所述文字进行突出显示标记。
2.如权利要求1所述的方法,其特征在于,利用所述N个目标特征参数的匹配度确定所述文字的准确率,包括:
确定所述N个目标特征参数对应的匹配度之和;
确定所述文字对应的匹配度占所述匹配度之和的比重,所述比重为所述文字的准确率。
3.如权利要求1所述的方法,其特征在于,如果所述准确率低于预设阈值,对所述文字进行突出显示标记,包括:
如果所述准确率低于预设阈值,对所述文字进行颜色标记。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取语音信号;
如果所述语音信号中语句停顿信号的延续时间超过预设时间,在所述语句停顿信号处对所述语音信号进行断句,形成语音信号片段;
对所述语音信号片段标记时间戳,所述语音信号片段为目标语音信号。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
利用所述语音信号片段的时间戳标记所述语音信号片段对应的文字段。
6.如权利要求4或5所述的方法,其特征在于,所述方法还包括:
当检测到播放指令时,获取待播放的文字;
确定所述待播放的文字所在文字段对应的时间戳;
播放所述时间戳对应的语音信号片段。
7.一种将语音转换为文字的装置,其特征在于,包括:
提取单元,用于提取目标语音信号的第一特征参数;
匹配单元,用于将第二特征参数与语音数据库中的第三特征参数进行匹配,确定N个目标特征参数,所述N个目标特征参数是所述第三特征参数中与所述第二特征参数匹配度最大的N个,N≥2,所述第二特征参数为所述第一特征参数中的一部分;
第一确定单元,用于确定与所述第二特征参数匹配度最大的一个目标特征参数对应的文字,并输出所述文字;
第二确定单元,用于利用所述N个目标特征参数的匹配度确定所述文字的准确率;
第一标记单元,用于如果所述准确率低于预设阈值时,对所述文字进行突出显示标记。
8.如权利要求7所述的装置,其特征在于,还包括:
获取单元,用于获取语音信号;
断句单元,用于当所述语音信号中语句停顿信号的延续时间超过预设时间时,在所述语句停顿信号处对所述语音信号进行断句,形成语音信号片段;
第二标记单元,用于对所述语音信号片段标记时间戳,所述语音信号片段为目标语音信号,以及利用所述语音信号片段的时间戳标记所述语音信号片段对应的文字段。
9.如权利要求8所述的装置,其特征在于,还包括:
第二获取单元,用于当接收到播放指令时,获取待播放的文字;
第三确定单元,用于确定所述待播放的文字所在文字段对应的时间戳;
播放单元,用于播放所述时间戳对应的语音信号片段。
10.一种将语音转换为文字的系统,其特征在于,包括:终端以及与所述终端连接的云端服务器;
所述终端,用于采集语音信号,并将采集后的语音信号发送给所述云端服务器;
所述云端服务器包括:
接收单元,用于接收所述终端发送的语音信号;
提取单元,用于提取所述语音信号的第一特征参数;
匹配单元,用于将第二特征参数与语音数据库中的第三特征参数进行匹配,确定N个目标特征参数,所述N个目标特征参数是所述第三特征参数中与所述第二特征参数匹配度最大的N个,N≥2,所述第二特征参数为所述第一特征参数中的一部分;
第一确定单元,用于确定与所述第二特征参数匹配度最大的一个目标特征参数对应的文字,并输出所述文字;
第二确定单元,用于利用所述N个目标特征参数的匹配度确定所述文字的准确率;
标记单元,用于当所述准确率低于预设阈值时,对所述文字进行突出显示标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京君林科技股份有限公司,未经北京君林科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711386363.3/1.html,转载请声明来源钻瓜专利网。