[发明专利]跨端声音复刻方法及系统在审
| 申请号: | 202211411279.3 | 申请日: | 2022-11-11 |
| 公开(公告)号: | CN116192825A | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 吴远刚;张志城;占必强;温火光 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | H04L67/01 | 分类号: | H04L67/01;H04L65/60;H04M1/72409;H04M1/72433 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 李彬彬;黄谦 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 方法 系统 | ||
本发明公开一种跨端声音复刻方法及系统,方法包括根据接收到的第一数据信息更新音色复刻信息,并将更新后的音色复刻信息发送至第二客户端,其中,第一数据信息是基于在第一客户端上采集的录音数据形成的,其至少包括与根据在第一客户端采集的录音数据训练得到的音色数据对应的用于唯一标识相应音色数据的音色信息,音色复刻信息包括存储在服务器中的全部音色信息;根据接收到的音色数据获取请求,获取目标音色数据发送至第二客户端,其中,音色数据获取请求是由第二客户端基于其接收到的更新后的音色复刻信息生成的,其包含有与要获取的目标音色数据对应的音色信息。本发明能够有效实现跨端的声音复刻,如在手机端录音,在车机端执行语音播报。
技术领域
本发明涉及智能语音技术领域,尤其涉及一种跨端声音复刻方法及系统。
背景技术
随着语音技术的发展,人们对输出音频提出了更高的要求,希望基于文本输入生成的音频,听起来像是特定说话人发出的声音。通过声音复刻技术能够满足这种个性化语音输出的要求,声音复刻技术的最终目标就是可以完全地模拟某个人的声音。
现有的声音复刻技术,如科大讯飞的声音复刻技术或腾讯AI声音复刻技术,主要都是基于TTS(Text To Speech,语音合成技术)和ASR(Automatic Speech Recognition,自动语音识别技术)技术实现的,其具体实现思路均是通过设备端录取几段音频发送给云端服务器去合成音色资源,云端服务器在合成好了之后会直接将合成的音色资源返回给设备端,而设备端在拿到这些音色资源后,在TTS播报时就会替换音色,以实现利用期望的音色资源来进行语音播报。
由于现有的声音复刻技术主要依赖对录取的音频进行音色资源合成训练来实现声音模拟,因而为了实现更精准的声音模拟即达到声音复刻技术的最终目标,录音的质量是非常关键的影响因素。然而,在实际应用场景中,存在一些无法高质量录音的设备端应用场景,如车机场景下,由于车机环境的嘈杂性和声源的多发性,要实现高质量录音是比较困难的,再如对于一些无屏设备由于不方便进行用户操作因而要实现精准拾音也是比较困难的,因此,就产生了跨端的声音复刻需求,其中,跨端的声音复刻是指录音和播报是在两种不同的设备端上实现的。然而,上述现有的声音复刻技术并不能解决跨端问题,无法应用在跨端声音复刻的场景下。
发明内容
本发明实施例提供一种跨端声音复刻方法及系统,以解决现有技术中无法实现手机端录音,车机端播报识别的跨端声音复刻播报的问题。
第一方面,本发明实施例提供一种跨端声音复刻方法,用于服务器,包括音色录制方法,包括:
根据接收到的第一数据信息更新音色复刻信息,并将更新后的音色复刻信息发送至第二客户端,其中,所述第一数据信息是基于在第一客户端上采集的录音数据形成的,其至少包括与根据在第一客户端采集的录音数据训练得到的音色数据对应的用于唯一标识相应音色数据的音色信息,所述音色复刻信息包括存储在所述服务器中的全部音色信息;
根据接收到的音色数据获取请求,获取目标音色数据发送至所述第二客户端,其中,所述音色数据获取请求是由第二客户端基于其接收到的所述更新后的音色复刻信息生成的,其包含有与要获取的目标音色数据对应的音色信息。
第二方面,本发明实施例提供一种跨端声音复刻方法,用于车机端,包括:
响应于接收到的音色复刻信息,根据音色复刻信息确定要获取的目标音色数据,其中,所述音色复刻信息包括有存储在服务器中的全部音色信息,服务器中存储的至少部分音色信息是基于在第一客户端上采集的录音数据形成,所述目标音色数据是根据基于在第一客户端上最新采集的录音数据形成的音色数据对应的音色信息确定的;
根据目标音色数据的确定结果生成音色数据获取请求发送至服务器,其中,音色数据获取请求包含有与要获取的目标音色数据对应的音色信息;
接收服务器基于音色数据获取请求返回的目标音色数据并将该目标音色数据设置为当前使用的用于播报语音的音色数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211411279.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种乳腺癌的分子标志物及其应用
- 下一篇:一种有源双向谐振腔移相器





