[发明专利]用于口音转化的系统和方法有效
申请号: | 201780079074.0 | 申请日: | 2017-12-20 |
公开(公告)号: | CN110199348B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | L·P·迪拉克;F·默兴;E·利伯蒂 | 申请(专利权)人: | 亚马逊技术股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G06F40/40;G10L13/10 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;娄晓丹 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 口音 转化 系统 方法 | ||
1.一种用于口音转化的系统,包括:
一个或多个处理器;
存储指令集合的一个或多个存储器,所述指令在由所述一个或多个处理器执行时,使得所述一个或多个处理器执行操作,这些操作包括:
接收多个音频样本;
将所述多个音频样本中的每一个与多种口音中的至少一种关联;
通过将与所述多种口音的第一口音关联的音频样本的第一样本音频特性组合,来确定所述第一口音的第一组合音频特性;
通过将与所述多种口音的第二口音关联的音频样本的第二样本音频特性组合,来确定所述第二口音的第二组合音频特性;
通过将所述第一口音的所述第一组合音频特性与所述第二口音的所述第二组合音频特性组合,来确定第三口音的第三组合音频特性;
将所述第三口音的所述第三组合音频特性和与所述多种口音中的至少一种其他口音关联的其他音频特性相比较;
生成第四口音与所述第三口音之间的转化模型;
接收第一口语的输入音频部分;以及
确定所述输入音频部分是否实质上与所述第四口音关联,如果是,至少部分地基于转化模型输出实质上与第一口语的第三口音关联的输出音频部分。
2.如权利要求1所述的系统,其中所述输出包括调节所述输入音频部分的至少一部分的音高、音调、重音或者旋律中的至少一个。
3.如权利要求1所述的系统,其中所述输入音频部分包括在第一方与第二方之间的音频通信会话期间由第一方说出的音频,并且其中在音频通信会话期间向第二方播放输出音频部分。
4.一种用于口音转化的方法,包括:
通过将与第一口音关联的音频样本的第一样本音频特性组合,来确定所述第一口音的第一组合音频特性;
通过将与第二口音关联的音频样本的第二样本音频特性组合,来确定所述第二口音的第二组合音频特性;
通过将所述第一口音的所述第一组合音频特性与所述第二口音的所述第二组合音频特性组合,来确定第三口音的第三组合音频特性;
将所述第三口音的所述第三组合音频特性和与一种或更多种其他口音关联的其他音频特性相比较;
生成第四口音与所述第三口音之间的转化模型;
接收与第一口语的所述第四口音实质上关联的输入音频部分;以及
至少部分地基于所述转化模型输出与所述第一口语的所述第三口音实质上关联的输出音频部分。
5.如权利要求4所述的方法,进一步包括确定所述输入音频部分实质上与所述第四口音关联。
6.如权利要求5所述的方法,其中至少部分地基于捕获所述输入音频部分的设备的地理位置将所述输入音频部分确定为实质上与所述第四口音关联。
7.如权利要求5所述的方法,其中通过至少部分地将所述输入音频部分的一种或多种音频特性和与所述第四口音关联的音频样本的一种或多种第四样本音频特性匹配,而将所述输入音频部分确定为实质上与所述第四口音关联。
8.如权利要求4所述的方法,进一步包括计算与所述输入音频部分关联的快速傅立叶变换或者梅尔频率倒谱系数中的至少一个,以标识音频输入部分的一种或多种音频特性。
9.如权利要求4所述的方法,其中所述输出包括调节所述输入音频部分的至少一部分的音高、音调、重音或者旋律中的至少一个。
10.如权利要求4所述的方法,其中至少部分地通过一种或多种人工神经网络确定所述转化模型。
11.如权利要求4所述的方法,其中所述输入音频部分包括在第一方与第二方之间的音频通信会话期间由第一方说出的音频,并且其中在音频通信会话期间向第二方播放输出音频部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊技术股份有限公司,未经亚马逊技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780079074.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:声音和振动的主动控制
- 下一篇:用于运行具有操作设备的机动车的方法