[发明专利]一种语音数据的处理方法和装置在审
申请号: | 201810914328.2 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109036422A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 武建昌;苏文畅 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/04;G06F17/24 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音数据 原始语音数据 文本数据 目标文本数据 方法和装置 编辑操作 处理内容 处理效率 波形图显示 接收用户 目标语音 语音识别 直观 | ||
1.一种语音数据的处理方法,其特征在于,包括:
获取待处理的原始语音数据;
对所述原始语音数据进行语音识别,得到文本数据;
接收用户对所述文本数据的编辑操作;
依据所述编辑操作对所述文本数据进行编辑,得到目标文本数据;
依据所述目标文本数据和所述原始语音数据,确定目标语音数据。
2.如权利要求1所述的处理方法,其特征在于,所述文本数据包括文本内容和时间信息,所述时间信息包括对齐的文本时间戳和语音时间戳,所述依据所述编辑操作对所述文本数据进行编辑,得到目标文本数据,包括:
依据所述编辑操作,对所述文本内容、所述文本时间戳和所述语音时间戳进行编辑得到目标文本数据。
3.如权利要求1所述的处理方法,其特征在于,所述依据所述编辑操作,对所述文本内容、所述文本时间戳和所述语音时间戳进行编辑得到目标文本数据,包括:
从所述文本内容中确定所述编辑操作对应的文本片段;
从所述语音时间戳中获取所述文本片段对应的语音片段时间戳;
从所述文本时间戳中获取所述文本片段对应的文本片段时间戳;
依据所述文本片段、语音片段时间戳、文本片段时间戳以及所述编辑操作对所述文本数据进行编辑,得到目标文本数据。
4.如权利要求3所述的处理方法,其特征在于,所述依据所述文本片段、语音片段时间戳、文本片段时间戳以及所述编辑操作对所述文本数据进行编辑,得到目标文本数据,包括:
依据所述文本片段和所述编辑操作对所述文本内容进行编辑,得到编辑后的文本内容;
依据所述语音片段时间戳、所述文本片段时间戳以及所述编辑操作对所述文本时间戳和所述语音时间戳进行调整,得到目标文本数据。
5.如权利要求1所述的处理方法,其特征在于,所述编辑操作包括复制操作、剪切操作、粘贴操作和删除操作中的至少一项。
6.如权利要求2-5任一项所述的处理方法,其特征在于,所述依据所述目标文本数据和所述原始语音数据,确定目标语音数据,包括:
依据所述目标文本数据从所述原始语音数据中提取多个语音片段;
采用所述多个语音片段合成目标语音数据。
7.如权利要求6所述的处理方法,其特征在于,所述依据所述目标文本数据从所述原始语音数据中提取多个语音片段,包括:
依据所述目标文本数据中的文本时间戳和语音时间戳,生成语音时序;
依据所述语音时序,从所述原始语音数据中提取多个语音片段。
8.如权利要求7所述的处理方法,其特征在于,所述语音时间戳包括语音片段的开始时间戳和结束时间戳,所述依据所述目标文本数据中的文本时间戳和语音时间戳,生成语音时序,包括:
依据所述文本时间戳的顺序,读取所述目标文本数据中的所有语音片段的开始时间戳和结束时间戳;
将所有语音片段的开始时间戳和结束时间戳作为元素添加到数组中;
删除所述数组中相邻的相同元素,得到语音时序。
9.如权利要求8所述的处理方法,其特征在于,所述依据所述语音时序,从所述原始语音数据中提取多个语音片段,包括:
以两个元素为步长将所述数组分为多个子数组;
以所述子数组中的两个元素分别为语音片段的开始时间和结束时间,将所述原始语音数据划分为多个语音片段;
提取所述多个语音片段。
10.如权利要求2-5任一项所述的处理方法,其特征在于,所述依据所述目标文本数据和所述原始语音数据,确定目标语音数据,包括:
依据所述目标文本数据中的文本时间戳和所述语音时间戳,生成语音时序;
依据所述语音时序对所述原始语音数据进行处理,得到目标语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810914328.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送方法及家电设备
- 下一篇:一种用于电脑的语音转化文字的输入系统及方法