[发明专利]语音处理方法和装置、用于语音处理的装置有效
申请号: | 201710198186.X | 申请日: | 2017-03-29 |
公开(公告)号: | CN106971723B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 牛露云;李洋;周麒麟 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/26 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘祥景 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 用于 | ||
1.一种语音处理方法,其特征在于,包括:
在针对语音流进行一次语音转写后,依据服务器针对所述语音流中语音数据包返回的处理结果,从所述语音流中语音数据包中,获取需要重新转写的目标语音数据包;其中,不同语音数据包对应相同的时间长度;所述处理结果包括:语音识别结果和/或错误码;所述语音识别结果为对所述语音数据包对应的语音片段进行语音识别得到;所述语音片段为利用动态的分割阈值,对所述语音数据包对应的语音信号进行分割得到;所述动态的分割阈值为依据所述语音信号所包括待分割语音信号中已经过语音活动检测的目标语音信号的时间长度得到;目标语音信号的时间长度等级包括:第一等级和第二等级,所述第二等级对应的时间长度大于所述第一等级对应的时间长度,所述第二等级对应的分割阈值小于所述第一等级对应的分割阈值;
向所述服务器重新发送所述目标语音数据包,以使所述服务器对所述目标语音数据包进行语音识别;
接收所述服务器针对所述目标语音数据包返回的语音识别结果;
将所述目标语音数据包对应的语音识别结果补充到所述语音流对应的语音转写结果中。
2.根据权利要求1所述的方法,其特征在于,所述获取需要重新转写的目标语音数据包,包括:
依据服务器针对所述语音流中语音数据包返回的语音识别结果,从所述语音流中语音数据包中,获取服务器未返回语音识别结果的语音数据包,作为需要重新转写的目标语音数据包;或者
依据服务器针对所述语音流中语音数据包返回的错误码,从所述语音流中语音数据包中,获取错误码符合预置条件的语音数据包,作为需要重新转写的目标语音数据包;或者
依据服务器针对所述语音流中语音数据包返回的语音识别结果和错误码,从所述语音流中语音数据包中,获取服务器未返回语音识别结果、且错误码符合预置条件的语音数据包,作为需要重新转写的目标语音数据包。
3.根据权利要求1或2所述的方法,其特征在于,所述向所述服务器重新发送所述目标语音数据包,包括:
响应于用户触发的续转指令,向所述服务器重新发送所述目标语音数据包。
4.根据权利要求3所述的方法,其特征在于,在所述获取需要重新转写的目标语音数据包之后、所述向所述服务器重新发送所述目标语音数据包之前,所述方法还包括:
输出提示信息;所述提示信息用于提示用户所述语音流的语音识别结果缺失。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在针对语音流进行一次语音转写的过程中,依据服务器针对语音流中语音数据包返回的处理结果,确定所述语音流对应的文本流;
响应于用户触发的标记添加指令,分别为所述语音流及其对应的文本流添加对应的标记。
6.根据权利要求5所述的方法,其特征在于,所述标记添加指令为通过蓝牙设备触发的标记添加指令。
7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在针对语音流进行一次语音转写的过程中,依据服务器针对语音流中语音数据包返回的处理结果,在播放编辑界面显示所述语音流对应的文本流;
在完成所述语音流的一次语音转写后,响应于用户针对所述播放编辑界面中文本触发的摘要处理指令,将所述摘要处理指令对应的目标文本设置为所述语音流对应文件的摘要。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在将所述摘要处理指令对应的目标文本设置为摘要后,跳转至摘要界面,所述摘要界面用于显示所述语音流对应文件的摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198186.X/1.html,转载请声明来源钻瓜专利网。