[发明专利]语音转写方法、装置、录音设备、系统与存储介质在审
申请号: | 202110963357.X | 申请日: | 2021-08-20 |
公开(公告)号: | CN113707151A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 王志军;常玉翠;张硕;陈睿 | 申请(专利权)人: | 天津讯飞极智科技有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 300300 天津市滨海新区自贸试*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 转写 方法 装置 录音 设备 系统 存储 介质 | ||
本发明提供一种语音转写方法、装置、录音设备、系统与存储介质,所述方法包括:接收录音设备实时录制并传输的语音数据流;将所述语音数据流上传至云端,以请求所述云端对所述语音数据流进行实时语音转写;接收所述云端返回的实时转写结果。本发明提供的方法、装置、录音设备、系统与存储介质,将用户终端作为录音设备与云端之间的数据中转,以更低成本的方式实现了语音数据流从录音设备到云端的实时传输;借助云端强大的语音处理能力,对语音数据流进行实时语音转写,并将实时转写结果返回给用户终端,从而提高了语音转写的效率和准确性,可以满足用户在录音过程中实时查看转写结果的需求,有助于优化用户体验。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音转写方法、装置、录音设备、系统与存储介质。
背景技术
目前市面上的主流录音笔应用场景较少,主要适用于会议、培训和采访等比较正式的场合,但是针对紧急事务记录、紧急会议等突发的或者要求无感知的录音场景,市面上的主流录音笔并不适用。
现有的穿戴式录音笔,虽然保证了录音场景的便捷性,但在语音转写过程中,需要手动上传录音文件进行转写,不能满足用户快速查看转写内容的需求。
发明内容
本发明提供一种语音转写方法、装置、录音设备、系统与存储介质,用以解决现有技术中无法满足突发或者要求无感知的录音场景下用户快速查看转写内容的需求的缺陷,实现满足用户在录音过程中实时查看转写结果的需求。
第一方面,本发明提供一种语音转写方法,所述方法应用于用户终端,所述方法包括:
接收录音设备实时录制并传输的语音数据流;
将所述语音数据流上传至云端,以请求所述云端对所述语音数据流进行实时语音转写;
接收所述云端返回的实时转写结果。
根据本发明提供的一种语音转写方法,所述接收录音设备实时录制并传输的语音数据流,之后还包括:
将所述语音数据流存储为语音文件;
确定所述语音数据流传输结束,则将所述语音文件的整体上传至所述云端,以请求所述云端对所述语音文件的整体进行语音转写;
接收所述云端返回的整体转写结果。
根据本发明提供的一种语音转写方法,所述将所述语音数据流存储为语音文件,包括:
将所述语音数据流存储为第一语音文件,对所述第一语音文件进行降噪,得到第二语音文件;
对所述第二语音文件进行音频压缩,得到所述语音文件。
根据本发明提供的一种语音转写方法,所述将所述语音数据流存储为第一语音文件,包括:
基于所述语音数据流进行音频解码并存储,得到所述第一语音文件,所述语音数据流的编码格式基于所述录音设备与所述用户终端之间的无线连接类型确定。
根据本发明提供的一种语音转写方法,还包括:
确定用户转写需求,所述用户转写需求是用户通过所述用户终端输入的,和/或通过所述录音设备输入并传输的;
将所述用户转写需求上传至云端,以请求所述云端基于所述用户转写需求进行语音转写。
第二方面,本发明还提供一种语音转写方法,所述方法应用于录音设备,所述方法包括:
获取实时录制的语音数据流;
将所述语音数据流实时传输至用户终端,以请求所述用户终端将所述语音数据流转发至云端进行实时语音转写,并接收所述云端返回的实时转写结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津讯飞极智科技有限公司,未经天津讯飞极智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110963357.X/2.html,转载请声明来源钻瓜专利网。