[发明专利]一种将语音转换为文字的方法、装置及系统在审

申请号：	201711386363.3	申请日：	2017-12-20
公开（公告）号：	CN109949813A	公开（公告）日：	2019-06-28
发明（设计）人：	王群	申请（专利权）人：	北京君林科技股份有限公司
主分类号：	G10L15/26	分类号：	G10L15/26
代理公司：	北京弘权知识产权代理事务所(普通合伙) 11363	代理人：	逯长明;许伟群
地址：	100107 北京市朝阳区天朗***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	特征参数目标特征参数准确率校验匹配度语音转换目标语音信号语音数据库装置及系统突出显示预设匹配输出保证发现
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种将语音转换为文字的方法以及装置，该方法包括：提取目标语音信号的第一特征参数；将第二特征参数与语音数据库中的第三特征参数进行匹配，确定N个目标特征参数，N≥2，N个目标特征参数是第三特征参数中与第二特征参数匹配度最大的N个，所述第二特征参数为所述第一特征参数中的一部分，确定与第二特征参数匹配度最大的一个目标特征参数对应的文字，并输出该文字；利用N个目标特征参数的匹配度确定文字的准确率；如果准确率低于预设阈值，对文字进行突出显示标记。本发明实施例能够使校验人员很容易地发现准确率较低的文字并判断该文字的正误，在方便校验的同时，还能够提高校验效率以及保证文字的准确率。

技术领域

本发明实施例涉及语音识别技术领域，尤其涉及一种将语音转换为文字的方法、装置及系统。

背景技术

目前，随着智能语音文字转换技术的发展，将语音转换为文字的效率得到了大大提高。智能语音文字转换技术可以应用于会议记录、培训记录或采访记录中。在对语音信号进行文字转换时，首先提取语音信号的特征参数，再将该特征参数与语音数据库中文字对应的特征参数进行匹配，从而得到匹配度最高的文字并输出。对于在安静环境下的标准普通话语音的文字转化，准确率较高。但是，在现实场景下，发言者无可避免地会带有一定的地方口音，并且无法保证在安静的环境下进行录音，所以无法保证语音文字转换的准确率。。

利用现有的智能语音文字转换技术得到的文字无法保证100％的准确率，所以需要人工对转换后的文字进行校验。通常的校验方法是，校验人员通篇进行阅读，以找到转换错误的文字，但是这种校验方式比较费时费力。而且，由于人工校验容易出现失误，有些错误不易被发现，从而导致文字错误率较高。

发明内容

本发明实施例提供了一种将语音转换为文字的方法及终端，以提供一种能够提高文字校验效率以及降低文字错误率的方法。

本发明实施例提供了一种将语音转换为文字的方法，包括：

提取目标语音信号的第一特征参数；

将第二特征参数与语音数据库中的第三特征参数进行匹配，确定N个目标特征参数，所述N个目标特征参数是所述第三特征参数中与所述第二特征参数匹配度最大的N个，N≥2，所述第二特征参数为所述第一特征参数中的一部分，；

确定与所述第二特征参数匹配度最大的一个目标特征参数对应的文字，并输出所述文字；

利用所述N个目标特征参数的匹配度确定所述文字的准确率；

如果所述准确率低于预设阈值，对所述文字进行突出显示标记。

进一步地，利用所述N个目标特征参数的匹配度确定所述文字的准确率，包括：

确定所述N个目标特征参数对应的匹配度之和；

确定所述文字对应的匹配度占所述匹配度之和的比重，所述比重为所述文字的准确率。