[发明专利]语音识别方法、音频标注方法、计算机设备、存储装置有效
| 申请号: | 201910975224.7 | 申请日: | 2019-10-14 |
| 公开(公告)号: | CN110853635B | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 洪志云;徐成茂 | 申请(专利权)人: | 广东美的白色家电技术创新中心有限公司;美的集团股份有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G06F40/117 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 瞿璨 |
| 地址: | 528311 广东省佛山市顺德区北*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 音频 标注 计算机 设备 存储 装置 | ||
本申请公开了语音识别方法、音频标注方法、计算机设备、具有存储功能的装置,其中语音识别方法包括:获得至少两个不同的自动语音识别ASR引擎识别同一音频后所得到的至少两份ASR文本;确定至少两份ASR文本中相同的文本内容和不同的文本内容;保留相同的文本内容,对不同的文本内容依次进行至少一个维度的共性比对,保留每个维度下具有共性的文本内容或文本内容的属性,直至遍历所有不同的文本内容;通过语言模型自动适配所有保留下来的文本内容或属性,以得到识别文本。通过上述方式,本申请能够提高语音识别的准确率。
技术领域
本申请涉及语音识别领域,特别是涉及语音识别方法、音频标注方法、计算机设备、具有存储功能的装置。
背景技术
ASR,英文的全称是Automated Speech Recognition,即自动语音识别技术,是一种将人的语音转换为文本的技术。伴随人工智能(AI,Artificial Intelligence)技术的发展,基于ASR技术的语音机器人、坐席助于、语音质检等智能产品得到了大量的推广。ASR技术的准确率将直接影响智能产品效果,而现有的ASR技术识别准确率较低。
发明内容
本申请主要解决的技术问题是提供一种语音识别方法、音频标注方法、计算机设备、具有存储功能的装置,能够解决目前ASR技术中准确率较低的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种语音识别方法,包括以下步骤:获得至少两个不同的自动语音识别ASR引擎识别同一音频后所得到的至少两份ASR文本;确定至少两份ASR文本中相同的文本内容和不同的文本内容;保留相同的文本内容,对不同的文本内容依次进行至少一个维度的共性比对,保留每个维度下具有共性的文本内容或文本内容的属性,直至遍历所有不同的文本内容;通过语言模型自动适配所有保留下来的文本内容或属性,以得到识别文本。
其中,保留相同的文本内容后包括:对保留的相同的文本内容设置位置标签;对不同的文本内容依次进行至少一个维度的共性比对包括:以设置标签后的相同的文本内容开始,从后往前对不同的文本内容依次进行至少一个维度的共性比对,和/或从前往后对不同的文本内容依次进行至少一个维度的共性比对。
其中,对不同的文本内容依次进行至少一个维度的共性比对,保留每个维度下具有共性的文本内容或文本内容的属性前包括:确定至少两份ASR文本中位置对应的不同的文本内容的字数是否相同;响应于不同的文本内容的字数相同,输出字数相同的文本内容作为至少部分保留下来的文本内容。
其中,确定至少两份ASR文本中位置对应的不同的文本内容的字数是否相同后包括:响应于不同的文本内容的字数不同,将每份ASR文本中对应字数不同位置的文本内容全部转换为拼音;字数最多的ASR文本保留对应位置的该部分拼音,字数较少的ASR文本保留每份ASR文本中拼音相同的部分,将字数最多的ASR文本中拼音不同的部分填充到字数较少的ASR文本中的拼音相应位置。
其中,获得至少两个不同的自动语音识别ASR引擎识别同一音频后所得到的至少两份ASR文本包括:获得三个不同的自动语音识别ASR引擎识别同一音频后所得到的三份ASR文本;对不同的文本内容依次进行至少一个维度的共性比对,保留每个维度下具有共性的文本内容或文本内容的属性包括:对不同的文本内容逐字进行单字比较,确定三份ASR文本中处于对应位置的字是否有两个字内容相同;响应于内容相同,输出相同的字作为至少部分保留下来的文本内容。
其中,对不同的文本内容逐字进行单字比较,确定三份ASR文本中处于对应位置的字是否有两个字相同包括:响应于内容不同,确定三份ASR文本中处于对应位置的字的拼音是否有两个字的拼音相同;响应于拼音相同,输出相同的拼音作为至少部分保留下来的文本内容的属性。
其中,确定三份ASR文本中处于对应位置的字的拼音是否有两个字的拼音相同后包括:响应于拼音不同,输出相同的拼音组成部分作为至少部分保留下来的文本内容的属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东美的白色家电技术创新中心有限公司;美的集团股份有限公司,未经广东美的白色家电技术创新中心有限公司;美的集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910975224.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种异形毛刷刷丝的生产工艺
- 下一篇:一种自动化采摘设备





