[发明专利]一种将语音转换为文字的方法、装置及系统在审
申请号: | 201711386363.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN109949813A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 王群 | 申请(专利权)人: | 北京君林科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100107 北京市朝阳区天朗*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征参数 目标特征参数 准确率 校验 匹配度 语音转换 目标语音信号 语音数据库 装置及系统 突出显示 预设 匹配 输出 保证 发现 | ||
本发明实施例公开了一种将语音转换为文字的方法以及装置,该方法包括:提取目标语音信号的第一特征参数;将第二特征参数与语音数据库中的第三特征参数进行匹配,确定N个目标特征参数,N≥2,N个目标特征参数是第三特征参数中与第二特征参数匹配度最大的N个,所述第二特征参数为所述第一特征参数中的一部分,确定与第二特征参数匹配度最大的一个目标特征参数对应的文字,并输出该文字;利用N个目标特征参数的匹配度确定文字的准确率;如果准确率低于预设阈值,对文字进行突出显示标记。本发明实施例能够使校验人员很容易地发现准确率较低的文字并判断该文字的正误,在方便校验的同时,还能够提高校验效率以及保证文字的准确率。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种将语音转换为文字的方法、装 置及系统。
背景技术
目前,随着智能语音文字转换技术的发展,将语音转换为文字的效率得到了大大提 高。智能语音文字转换技术可以应用于会议记录、培训记录或采访记录中。在对语音信号进行文字转换时,首先提取语音信号的特征参数,再将该特征参数与语音数据库中文 字对应的特征参数进行匹配,从而得到匹配度最高的文字并输出。对于在安静环境下的 标准普通话语音的文字转化,准确率较高。但是,在现实场景下,发言者无可避免地会 带有一定的地方口音,并且无法保证在安静的环境下进行录音,所以无法保证语音文字 转换的准确率。。
利用现有的智能语音文字转换技术得到的文字无法保证100%的准确率,所以需要人 工对转换后的文字进行校验。通常的校验方法是,校验人员通篇进行阅读,以找到转换 错误的文字,但是这种校验方式比较费时费力。而且,由于人工校验容易出现失误,有些错误不易被发现,从而导致文字错误率较高。
发明内容
本发明实施例提供了一种将语音转换为文字的方法及终端,以提供一种能够提高文 字校验效率以及降低文字错误率的方法。
本发明实施例提供了一种将语音转换为文字的方法,包括:
提取目标语音信号的第一特征参数;
将第二特征参数与语音数据库中的第三特征参数进行匹配,确定N个目标特征参数, 所述N个目标特征参数是所述第三特征参数中与所述第二特征参数匹配度最大的N个,N≥2,所述第二特征参数为所述第一特征参数中的一部分,;
确定与所述第二特征参数匹配度最大的一个目标特征参数对应的文字,并输出所述 文字;
利用所述N个目标特征参数的匹配度确定所述文字的准确率;
如果所述准确率低于预设阈值,对所述文字进行突出显示标记。
进一步地,利用所述N个目标特征参数的匹配度确定所述文字的准确率,包括:
确定所述N个目标特征参数对应的匹配度之和;
确定所述文字对应的匹配度占所述匹配度之和的比重,所述比重为所述文字的准确 率。
进一步地,如果所述准确率低于预设阈值,对所述文字进行突出显示标记,包括:
如果所述准确率低于预设阈值,对所述文字进行颜色标记。
进一步地,所述方法还包括:
获取语音信号;
如果所述语音信号中语句停顿信号的延续时间超过预设时间,在所述语句停顿信号 处对所述语音信号进行断句,形成语音信号片段;
对所述语音信号片段标记时间戳,所述语音信号片段为目标语音信号。
进一步地,所述方法还包括:
利用所述语音信号片段的时间戳标记所述语音信号片段对应的文字段。
进一步地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京君林科技股份有限公司,未经北京君林科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711386363.3/2.html,转载请声明来源钻瓜专利网。