[发明专利]音频处理方法、装置、智能设备及介质有效
申请号: | 201810276931.2 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108492826B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 褚长森 | 申请(专利权)人: | 北京金山安全软件有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G11B27/10 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 智能 设备 介质 | ||
1.一种音频处理方法,其特征在于,包括:
接收语音指令;
对所述语音指令中的内容进行语义分析;
在语义分析后得到所述语音指令的语音内容的情况下,从预设的至少一组语音内容与音频文件的对应关系中,查找与语义分析得到的语音内容相对应的预设音频文件;在语义分析后不能准确得到所述语音指令的语音内容的情况下,获取智能设备的历史播放记录,所述历史播放记录是智能设备已播放过的处理结果,根据所述历史播放记录确定所述预设音频文件;所述预设音频文件包括第一音频文件和第二音频文件;
处理所述语音指令的同时,播放所述预设音频文件;其中,播放所述预设音频文件包括播放所述第一音频文件,当获取所述语音指令的处理结果时,停止播放所述第一音频文件,开始播放所述第二音频文件;
当所述预设音频文件播放结束时,播放所述语音指令的处理结果;
所述预设音频文件的播放时长不小于获取所述处理结果所需的目标时长。
2.根据权利要求1所述的方法,其特征在于,所述播放所述第一音频文件之前,所述方法还包括:
确定获取到所述处理结果所需的目标时长;
对所述第一音频文件进行处理,以使所述第一音频文件的播放时长等于所述目标时长。
3.根据权利要求1所述的方法,其特征在于,所述第一音频文件和所述第二音频文件的语义内容相同或不同。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述播放所述预设音频文件,包括:
以第一音调播放所述第一音频文件;
当获取到所述语音指令的所述处理结果时,以第二音调播放所述第二音频文件。
5.根据权利要求1所述的方法,其特征在于,所述播放所述预设音频文件,包括:
通过深度学习模型,获取所述语音指令的音色,作为目标音色;
以所述目标音色播放所述预设音频文件。
6.根据权利要求5所述的方法,其特征在于,所述通过深度学习模型,获取所述语音指令的音色之前,所述方法还包括:
获取样本音频文件;
利用所述样本音频文件对预设的深度学习模型进行音色识别训练,得到满足预设条件的深度学习模型。
7.一种音频处理装置,其特征在于,包括:
接收单元,用于接收语音指令;
处理单元,用于对所述语音指令中的内容进行语义分析;
确定单元,用于:
在语义分析后得到所述语音指令的语音内容的情况下,从预设的至少一组语音内容与音频文件的对应关系中,查找与语义分析得到的语音内容相对应的预设音频文件;在语义分析后不能准确得到所述语音指令的语音内容的情况下,获取智能设备的历史播放记录,所述历史播放记录是智能设备已播放过的处理结果,根据所述历史播放记录确定所述预设音频文件;所述预设音频文件包括第一音频文件和第二音频文件;
所述处理单元,用于处理所述语音指令;
播放单元,用于在处理单元处理所述语音指令的同时,播放所述预设音频文件,其中,播放所述预设音频文件包括播放所述第一音频文件,当获取所述语音指令的处理结果时,停止播放所述第一音频文件,开始播放所述第二音频文件;
所述播放单元,还用于当所述预设音频文件播放结束时,播放所述语音指令的处理结果。
8.根据权利要求7所述的装置,其特征在于,
所述确定单元,还用于确定获取到所述处理结果所需的目标时长;
所述处理单元,还用于对所述第一音频文件进行处理,以使所述第一音频文件的播放时长等于所述目标时长。
9.根据权利要求7所述的装置,其特征在于,所述第一音频文件和所述第二音频文件的语义内容相同或不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810276931.2/1.html,转载请声明来源钻瓜专利网。