专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果53个,建议您升级VIP下载更多相关专利
  • [发明专利]信号生成处理装置-CN202180083413.9在审
  • 冈本拓磨;户田智基;志贺芳则;河井恒 - 国立研究开发法人情报通信研究机构
  • 2021-12-17 - 2023-09-01 - G10L13/06
  • 本发明实现信号生成处理装置,该信号生成处理装置实现可以保持语音合成处理或图像信号生成的速度且获得高质量的语音信号或图像信号的语音合成处理或图像信号生成处理。在信号生成处理装置中,第一子模型部~第N子模型部分别使用不同的噪声水平的范围中包含的噪声水平进行第一子模型部~第N子模型部中包含的学习模型的学习处理,从而获取已学习模型。也就是说,在信号生成处理装置中,可以针对各子模型部并行地进行处理,其结果是,可以高速地进行学习处理。另外,在信号生成处理装置中,在预测处理时,可以适当地选择所使用的子模型部进行处理,因此可以执行高精度的语音合成处理或图像生成处理。
  • 信号生成处理装置
  • [发明专利]语音克隆模型的训练方法、可读存储介质和语音克隆方法-CN202010476440.X有效
  • 张子宁;杨晓艳;张振杰 - 新加坡依图有限责任公司(私有)
  • 2020-05-29 - 2023-08-08 - G10L13/06
  • 本申请提供了一种语音克隆模型的训练方法、可读存储介质和语音克隆方法,训练方法包括:将经过预处理的语料数据输入应用于语音克隆的神经网络模型,语料数据用于训练神经网络模型,语料数据包括多个发音人的多种语言的语音数据和语音数据对应的文本数据;利用神经网络模型的发音人嵌入模块和编码器模块分别对每个发音人的语音数据和相应的文本数据进行处理,生成发音人的语音嵌入数据和相应的文本数据的文本嵌入数据;将文本嵌入数据与语音嵌入数据合并,作为注意力机制模块的输入参数,并且将语音数据作为参考标准,训练神经网络模型;在损失函数满足预定值的情况下,得到应用于语音克隆的神经网络模型。
  • 语音克隆模型训练方法可读存储介质
  • [发明专利]车载语音定制系统、方法及设备-CN202310309467.3在审
  • 高斯雄;刁楷 - 重庆长安汽车股份有限公司
  • 2023-03-27 - 2023-06-27 - G10L13/06
  • 本发明实施例提供一种车载语音定制系统、方法及设备,属于智能语音交互技术领域。车载语音定制系统包括界面显示模块、信息管理模块、语音制作模块以及平台交易模块,界面显示模块,用于显示信息和识别用户操作,并基于用户操作进行对应模块的调用;信息管理模块,用于管理个性化语音包资源以及用户账号信息;语音制作模块,用于基于用户的编辑操作生成及存储个性化语音包资源;平台交易模块,用于对个性化语音包资源进行定价,并将个性化语音包资源上传至界面显示模块进行售卖。本发明实施例通过个性化制作及购买使用,实现了价值的转换,提高了用户的参与感和体验感。
  • 车载语音定制系统方法设备
  • [发明专利]语音克隆模型生成方法、装置及电子设备-CN202211419993.7在审
  • 司玉景;王通;李全忠 - 普强时代(珠海横琴)信息技术有限公司
  • 2022-11-14 - 2023-03-21 - G10L13/06
  • 本说明书实施例提供了一种语音克隆模型生成方法、装置及电子设备,其中,方法包括:构建包含多个说话人音色的语音合成音库;基于所述语音合成音库训练得到包含多个说话人ID的语音合成基础模型;获取目标说话人的语音和标注,从所述语音合成音库中查找到和所述目标说话人的发音相似度最高的说话人ID;在语音合成基础模型中设置该说话人的ID作为语音克隆的预训练模型,利用目标说话人的语音和标注文本,进行自适应训练,得到所述目标说话人的语音合成模型。本发明可以避免由于预训练模型和目标说话人发音差异较大而导致的语音克隆效果差的现象,进一步提高了语音克隆的合成效果和鲁棒性。
  • 语音克隆模型生成方法装置电子设备
  • [发明专利]一种停顿位置预测方法、语音合成方法及相关设备-CN202111339548.5在审
  • 祖漪清;朱荣华;刘晨宁;陆晨;邵鹏飞 - 科大讯飞股份有限公司
  • 2021-11-12 - 2022-03-11 - G10L13/06
  • 本申请提供了一种停顿位置预测方法、语音合成方法及相关设备,其中,停顿位置预测方法包括:获取目标文本;基于预先建立的第一词典,对目标文本进行分词,获得目标文本的分词结果,其中,第一词典中包括若干第一基本语言单元和若干第二基本语言单元,第一基本语言单元为发生连读的多个文法词组成的文法词串,第二基本语言单元为不与其他文法词发生连读的单个文法词;根据目标文本的分词结果,预测目标文本的停顿位置。经由本申请提供的停顿位置预测方法可预测出较为合理的停顿位置,根据采用本申请提供的停顿位置预测方法针对目标文本预测的停顿位置进行语音合成,能够获得效果较好的合成语音。
  • 一种停顿位置预测方法语音合成相关设备
  • [发明专利]将文本数据转换为音素序列的方法及设备-CN202110832833.4在审
  • 吴志勇;宋长河;周逸轩;卞衍尧 - 腾讯科技(深圳)有限公司;清华大学深圳国际研究生院
  • 2021-07-22 - 2021-12-21 - G10L13/06
  • 公开了一种将文本数据转换为音素序列的方法、装置、设备、和计算机可读存储介质。该将文本数据转换为音素序列的方法包括:基于所述文本数据中的句子,提取所述句子对应的句义特征和所述句子中的一个或多个连续字符对应的字符语义特征,基于所述句子对应的句义特征,确定所述句子对应的语法特征,基于所述字符语义特征和所述句子对应的语法特征,确定多音字特征,所述多音字特征指示字符的多音字发音信息,以及基于所述语法特征和所述多音字特征,确定所述句子对应的音素序列。本公开利用神经网络提取了文本数据中的语法特征和多音字特征并将上述的特征以级联的方式进行了融合,并可选地引入了文本数据中的变调信息,使得合成的语音更加自然。
  • 文本数据转换音素序列方法设备
  • [发明专利]语音合成装置、语音合成方法及存储介质-CN201580082427.3有效
  • 田村正统;森田真弘 - 株式会社东芝
  • 2015-09-16 - 2021-12-17 - G10L13/06
  • 本公开涉及语音合成装置、语音合成方法及存储介质。实施方式的语音合成装置具有:存储部,将具有多个状态的统计模型的各状态下的、包含基音特征参数的音响特征参数的输出分布及基于时刻参数的持续长度分布作为统计模型信息进行存储;制作部,根据与输入文本对应的上下文信息及统计模型信息,制作统计模型序列;决定部,使用基于统计模型序列的各统计模型的各状态的持续长度分布而得到的持续时间长度及基于基音特征参数的输出分布而得到的基音信息,决定各状态的基音波形数;生成部,基于基音波形数来生成音响特征参数的输出分布列,基于该输出分布列来生成音响特征参数;及波形生成部,根据所生成的音响特征参数来生成语音波形。
  • 语音合成装置方法存储介质
  • [发明专利]发音词典生成方法及装置、存储介质、电子设备-CN201710805626.3有效
  • 方昕;刘俊华;魏思;胡国平 - 科大讯飞股份有限公司
  • 2017-09-08 - 2021-05-04 - G10L13/06
  • 本公开提供一种发音词典生成方法及装置、存储介质、电子设备。该方法包括:获取待确定发音词语对应的语音片段,并针对所述待确定发音词语构建发音识别网络,所述发音识别网络中包括所述待确定发音词语的正确发音单元以及音变发音单元;利用所述发音识别网络对所述语音片段进行解码,确定出所述语音片段对应的发音路径,所述发音路径由所述正确发音单元和/或所述音变发音单元构成;计算所述发音路径表示的发音的置信度,并利用置信度高于预设值的发音路径表示的发音,生成所述待确定发音词语的发音词典。如此方案,可以使生成的发音词典更符合用户的实际发音,准确性更高。
  • 发音词典生成方法装置存储介质电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top