[发明专利]语音识别结果评价方法及系统有效
申请号: | 201510796906.3 | 申请日: | 2015-11-17 |
公开(公告)号: | CN105336342B | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 王金钖;潘青华;高建清 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/05;G10L15/32 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 刘路尧;逢京喜 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 结果 评价 方法 系统 | ||
本发明公开了一种语音识别结果评价方法及系统,该方法包括:对语音数据进行端点检测,得到各有效语音段;对各有效语音段进行语音识别,得到各有效语音段对应的识别文本段;提取各识别文本段的评价特征;利用预先构建的识别结果评价模型及所述评价特征对各识别文本段进行评价,得到各识别文本段的评价结果;抽查所述评价结果的准确率,并且如果有准确率低于设定阈值的评价结果,则结合人工评价对全部或部分识别文本段的评价结果进行修正;修正结束后,输出最终评价结果。利用本发明,可以减少人工工作量,并提高语音数据识别结果评价的准确率。
技术领域
本发明涉及语音信号处理领域,具体涉及一种语音识别结果评价方法及系统。
背景技术
随着语音识别技术的快速发展,越来越多的技术领域采用录音的方式记录重要的信息,如语音会议转写系统即为典型的应用,采用录音的形式记录会议沟通的内容,然后将录音通过语音识别的方法转写为文本,基于该文本进行会议记录的编辑并保存。然而,由于受到录音时噪声、远场、口音等因素的影响,语音识别的准确率还未完全达到要求。对于重要的语音数据,如重要会议的录音数据,一般要求达到较高的识别准确率,用户需要通过听语音数据判断识别结果的可信度;如果可以直接给出识别结果的评价,用户可以直观地知道识别结果的可信度,根据评价结果确定是否需要对识别结果进行修改,无疑给用户带来很大便利。
现有语音识别结果的评价方法一般是人工抽查部分识别结果,听识别结果对应的语音数据来给出评价,如识别结果较差或较好等。而现有方法随机抽取的识别结果并不能从总体上判断所有识别结果的好坏,不具有代表性,如果抽取的识别结果都较好或较差,容易误导用户对总体识别结果的可信度的判断。此外,人工对识别结果进行评价,每个人的评价标准很难统一,主观性较强;并且在识别结果较多时,工作量较大,成本较高。
发明内容
本发明提供一种语音识别结果评价方法及系统,以减少人工工作量,并提高语音数据识别结果评价的准确率。
为此,本发明提供如下技术方案:
一种语音识别结果评价方法,包括:
对语音数据进行端点检测,得到各有效语音段;
对各有效语音段进行语音识别,得到各有效语音段对应的识别文本段;
提取各识别文本段的评价特征;
利用预先构建的识别结果评价模型及所述评价特征对各识别文本段进行评价,得到各识别文本段的评价结果;
抽查所述评价结果的准确率,并且如果有准确率低于设定阈值的评价结果,则结合人工评价对全部或部分识别文本段的评价结果进行修正;
修正结束后,输出最终评价结果。
优选地,所述评价特征包括:识别结果置信度分布、以及以下一种或多种特征:槽平均弧数、词平均时长、句中停止词占比。
优选地,所述方法还包括:
按以下方式构建所述识别结果评价模型:
收集语音数据,并对其进行语音识别,得到识别结果;
提取所述识别结果的评价特征,并人工标注识别结果的评价等级,作为所述识别结果的标注特征;
利用所述评价特征及标注特征,训练识别结果评价模型。
优选地,所述评价结果包括多个等级,每个等级作为一类;
所述抽查所述评价结果的准确率包括:
抽查所述评价结果中的一类或多类评价结果的准确率。
优选地,所述抽查所述评价结果的准确率,并且如果有准确率低于设定阈值的评价结果,则结合人工评价对全部或部分识别文本段的评价结果进行修正包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510796906.3/2.html,转载请声明来源钻瓜专利网。