[发明专利]一种语音处理方法及装置有效
申请号: | 201810448810.1 | 申请日: | 2018-05-11 |
公开(公告)号: | CN110473519B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 石鹏;刘雨;梁文波 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 | ||
本发明提供了语音处理方法及装置,获取待进行语音识别的语音文件,在所述语音文件中识别用于切分语音文件的语音切分点,并根据识别出的语音切分点,对所述语音文件进行切分,得到至少两个所述语音子文件,分别对每个所述语音子文件进行语音识别,得到每个所述语音子文件对应的语音识别结果,基于每个所述语音子文件对应的语音识别结果,得到所述语音文件的语音识别结果。本发明能够对获取的语音文件进行切分,得到多个语音子文件,进而就能够同时对每个语音子文件进行语音识别,能够缩短语音识别时间,提高用户体验。
技术领域
本发明涉及语音处理领域,更具体的说,涉及一种语音处理方法及装置。
背景技术
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
现有技术中,在进行语音识别时,首先使用可以收音的设备获取得到语音文件,采用语音识别算法识别得到相应的识别结果。
但当收音时间较长时,就会获取大量的语音文件,进而使得语音识别时间较长,影响用户体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音处理方法及装置。
具体技术方案如下:
一种语音处理方法,包括:
获取待进行语音识别的语音文件;
在所述语音文件中识别用于切分语音文件的语音切分点,并根据识别出的语音切分点,对所述语音文件进行切分,得到至少两个语音子文件;
分别对每个所述语音子文件进行语音识别,得到每个所述语音子文件对应的语音识别结果;
基于每个所述语音子文件对应的语音识别结果,得到所述语音文件的语音识别结果。
优选地,在所述语音文件中识别用于切分语音文件的语音切分点,包括:
识别出所述语音文件中,对应的振幅值小于第一预设数值的至少一个时间点;
将识别出的每个所述时间点分别作为一个所述语音切分点。
优选地,在所述语音文件中识别用于切分语音文件的语音切分点,包括:
识别出所述语音文件中,对应的振幅值小于第一预设数值的至少一个时间点;
计算相邻两个所述时间点的时间间隔;
基于每一所述时间间隔,计算切分成的所述语音子文件的数量;其中,切分得到的相邻两个所述语音子文件的时间长度差在第二预设数值内;
根据计算得到的所述数量,从至少一个所述时间点中选取得到所述语音切分点。
优选地,在所述语音文件中识别用于切分语音文件的语音切分点,包括:
识别出所述语音文件中,对应的持续振幅值小于第三预设数值的时间段;
从识别出的时间段中选取出时间长度不小于第四预设数值的时间段;
将选取出的时间段中的起始时间点作为所述语音切分点。
优选地,在所述语音文件中识别用于切分语音文件的语音切分点,并根据识别出的语音切分点,对所述语音文件进行切分,得到至少两个语音子文件后,还包括:
依据每一所述语音子文件在所述语音文件中的位置,为每一所述语音子文件设置一个顺序标识;
相应的,基于每个所述语音子文件对应的语音识别结果,得到所述语音文件的语音识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810448810.1/2.html,转载请声明来源钻瓜专利网。