[发明专利]一种语音切分方法及装置、计算机装置和可读存储介质有效
| 申请号: | 201811208983.2 | 申请日: | 2018-10-17 |
| 公开(公告)号: | CN109448705B | 公开(公告)日: | 2021-01-29 |
| 发明(设计)人: | 张新;王慧君;毛跃辉;廖湖锋;李保水;连园园;万会 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
| 主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/22;G06K9/00 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
| 地址: | 519070*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 切分 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种语音切分方法及装置、计算机装置和可读存储介质,其中,所述方法包括:采集获得图像;确定所述图像所对应的智能家居场景;在所述智能家居场景下采集到音频数据之后,确定所述智能家居场景对应的语音端点检测的灵敏度;按照与所述灵敏度对应的音频时长对所述音频数据进行切分,确定待识别语音段。用于解决现有采用语音端点检测的语音切分方法存在错误率高,语音识别效果差的技术问题。
技术领域
本发明涉及智能家居技术领域,特别涉及一种语音切分方法及装置、计算机装置和可读存储介质。
背景技术
语音端点检测作为一种人机交互的手段,在解放人类双手方面意义重大。
具体来讲,语音端点检测就是从连续的语音流中将有效语音(也就是说,人说话的声音)的部分与外界的噪音或者是静音分割开来,降低存储或传输的数据量,以减少设备的计算负载,实现语音的快速识别。其主要包括两个方面,检测出有效语音的起始点即前端点,检测出有效语音的结束点即后端点。
为了考察语音能量值的变化,需要先将语音信号按照固定时长比如20毫秒进行分割,每个分割单元称为帧。每帧中包含数量相同的采样点,然后计算每帧语音的能量值。如果音频前面部分连续M0帧的能量值低于一个事先指定的能量值阈值E0,接下来的连续M0帧能量值大于E0,则能量值增大的地方为语音的前端点。如果连续的若干帧能量值较大,随后的帧能量值变小,并且持续一定的时长,则能量值减小的地方为语音的后端点。其中,M0值的大小决定了语音端点检测的灵敏度。M0值越小,音频时长越短,语音端点检测的灵敏度越高,反之,M0值越大,音频时长越长,语音端点检测的灵敏度越低。
此外,理想情况下静音能量值为0。然而,采集音频的场景中往往有一定强度的背景音,这种单纯的背景音当然算静音,但其能量值显然不为0,因此,实际采集到的音频其背景音通常有一定的基础能量值。假设音频起始处的一小段语音是静音,在估计E0时,选取一定数量的帧(比如前100帧语音数据),计算其平均能量值,然后加上一个经验值或乘以一个大于1的系数,由此得到E0,并将其作为判断一帧语音是否是静音的基准,大于这个值就是有效语音,小于这个值就是静音。
现有语音识别设备常采用较为固定的语音端点检测灵敏度,来切分语音。比如,不管是多人交流场景,还是单人交流场景,智能家居设备A的语音端点检测的灵敏度始终为E0。然而,由于多人交流场景较单人交流场景,环境较为嘈杂,不易切分,仍采用固定的语音端点检测的灵敏度E0来进行语音切分,很容易导致语音切分错误,进而导致语音识别错误。可见,采用固定的语音端点检测的灵敏度E0来进行语音切分,切分结果时好时坏。
也就是说,现有采用语音端点检测的语音切分方法存在错误率高,语音识别效果差的技术问题。
发明内容
本发明实施例提供一种语音切分方法及装置、计算机装置及可读存储介质,用于解决现有采用语音端点检测的语音切分方法存在错误率高,语音识别效果差的技术问题。
第一方面,本发明实施例提供了一种语音切分方法,包括:
采集获得图像;
确定所述图像所对应的智能家居场景;
在所述智能家居场景下采集到音频数据之后,确定所述智能家居场景对应的语音端点检测的灵敏度;
按照与所述灵敏度对应的音频时长对所述音频数据进行切分,确定待识别语音段。
在本发明实施例的技术方案中,通过采集图像,进而确定该图像所对应的智能家居场景,一旦在该智能家居场景下采集到音频数据,便可以按照该智能家居场景所对应的语音端点检测的灵敏度来对音频数据进行切分,进而确定待识别语音段。也就是说,在对音频数据进行切分时,根据智能家居场景自适应调整语音端点检测的灵敏度,从而保证了对音频数据的正确切分,改善了语音识别的识别效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811208983.2/2.html,转载请声明来源钻瓜专利网。





