[发明专利]一种处理音频文件的方法及相关装置在审
申请号: | 201910233313.4 | 申请日: | 2019-03-26 |
公开(公告)号: | CN109960685A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 王泽龙 | 申请(专利权)人: | 广州国音智能科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F3/0481;G10L21/14 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 删除 删除处理 实时获取 相关装置 指针 频域 预设 三维 后台 矩阵 输入设备控制 擦除指令 界面显示 矩阵转换 区域选定 时域数据 预设规则 预先设置 编程 发送 指令 转换 申请 | ||
本申请实施例公开了一种处理音频文件的方法及相关装置,包括:在预设界面显示由音频文件转换得到的语谱图;当接收到区域选定指令后,实时获取指针在所述语谱图中的位置,所述指针预先设置在所述预设界面中且由相应的输入设备控制;根据指针在所述语谱图中的位置和预设规则实时获取待删除区域;当接收到擦除指令后,将获取到的所有所述待删除区域发送至后台,使得后台根据所述待删除区域对所述语谱图对应的三维频域矩阵进行删除处理;将经过删除处理的三维频域矩阵转换为音频的时域数据。解决了现有的方法只适用于会编程的程序员而不适用于一般工作人员的技术问题。
技术领域
本申请涉及音频处理技术领域,尤其涉及一种处理音频文件的方法及相关装置。
背景技术
语谱图是指语音频谱图,一般是通过处理接收的时域信号得到频谱图,因此只要有足够时间长度的时域信号就可。专业点讲,那是频谱分析视图,如果针对语音数据的话,叫语谱图。语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于是采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色深,表示该点的语音能量越强。
目前,在对处理音频文件的过程中,会将音频文件先转化成语谱图,然后根据语谱图对音频文件进行分析;在分析过程中,有时需要将语谱图的不需要的部分区域进行擦除,而现有的擦除方法主要是通过编程代码实现的,即工作人员直接将不需要的部分区域的坐标参数转换成编程代码,通过变成代码删除不需要的部分区域。
但该方法只适用于会编程的程序员,不适用于一般的工作人员,例如声纹鉴定工作的人。
发明内容
本申请实施例提供了一种处理音频文件的方法及相关装置,解决了现有的方法只适用于会编程的程序员而不适用于一般工作人员的技术问题。
有鉴于此,本申请第一方面提供了一种处理音频文件的方法,包括:
在预设界面显示由音频文件转换得到的语谱图;
当接收到区域选定指令后,实时获取指针在所述语谱图中的位置,所述指针预先设置在所述预设界面中且由相应的输入设备控制;
根据指针在所述语谱图中的位置和预设规则实时获取待删除区域;
当接收到擦除指令后,将获取到的所有所述待删除区域发送至后台,使得后台根据所述待删除区域对所述语谱图对应的三维频域矩阵进行删除处理;
将经过删除处理的三维频域矩阵转换为音频的时域数据。
优选地,
所述的方法还包括:在根据指针在所述语谱图中的位置和预设规则实时获取待删除区域的同时,调用界面显示接口以在所述预设界面中显示语谱图中除所述待删除区域之外的其他区域。
优选地,
在根据指针在所述语谱图中的位置和预设规则实时获取待删除区域之后,在当接收到擦除指令之前,还包括:
当接收到撤销指令后,清空获取到的所述待删除区域。
优选地,
所述输入设备为鼠标;
所述区域选定指令包括鼠标按压。
优选地,
所述擦除指令包括界面保存指令。
优选地,
后台根据所述待删除区域对所述语谱图对应的三维频域矩阵进行删除处理包括:
后台将所述语谱图对应的三维频域矩阵中所述待删除区域的语音数据能量调整为0。
本申请第二方面提供一种处理音频文件的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233313.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理装置及存储介质
- 下一篇:数据库的日志处理方法和装置