“G10L13/06”专利分类搜索_专利查询_文献下载_出售_求购_买卖_交易

钻瓜专利网为您找到相关结果53个，建议您升级VIP下载更多相关专利

[发明专利]信号生成处理装置-CN202180083413.9在审
发明人：冈本拓磨;户田智基;志贺芳则;河井恒 -专利权人：国立研究开发法人情报通信研究机构
申请日： 2021-12-17 - 公布日： 2023-09-01 - 主分类号： G10L13/06 文献下载
摘要：本发明实现信号生成处理装置，该信号生成处理装置实现可以保持语音合成处理或图像信号生成的速度且获得高质量的语音信号或图像信号的语音合成处理或图像信号生成处理。在信号生成处理装置中，第一子模型部～第N子模型部分别使用不同的噪声水平的范围中包含的噪声水平进行第一子模型部～第N子模型部中包含的学习模型的学习处理，从而获取已学习模型。也就是说，在信号生成处理装置中，可以针对各子模型部并行地进行处理，其结果是，可以高速地进行学习处理。另外，在信号生成处理装置中，在预测处理时，可以适当地选择所使用的子模型部进行处理，因此可以执行高精度的语音合成处理或图像生成处理。
信号生成处理装置

[发明专利]声音合成方法、声音合成装置及存储介质-CN201880077158.5有效
发明人：大道龙之介;清水正宏 -专利权人：雅马哈株式会社
申请日： 2018-11-28 - 公布日： 2023-08-11 - 主分类号： G10L13/06 文献下载
摘要：声音合成装置具有：第1训练好的模型，其生成与包含音位的指定在内的控制数据相对应的谐波成分的频谱的时间序列；第2训练好的模型，其生成与所述控制数据相对应的非谐波成分的波形信号；以及合成处理部，其根据所述频谱的时间序列和所述波形信号而生成包含所述谐波成分和所述非谐波成分在内的声音信号。
声音合成方法装置存储介质

[发明专利]语音克隆模型的训练方法、可读存储介质和语音克隆方法-CN202010476440.X有效
发明人：张子宁;杨晓艳;张振杰 -专利权人：新加坡依图有限责任公司（私有）
申请日： 2020-05-29 - 公布日： 2023-08-08 - 主分类号： G10L13/06 文献下载
摘要：本申请提供了一种语音克隆模型的训练方法、可读存储介质和语音克隆方法，训练方法包括：将经过预处理的语料数据输入应用于语音克隆的神经网络模型，语料数据用于训练神经网络模型，语料数据包括多个发音人的多种语言的语音数据和语音数据对应的文本数据；利用神经网络模型的发音人嵌入模块和编码器模块分别对每个发音人的语音数据和相应的文本数据进行处理，生成发音人的语音嵌入数据和相应的文本数据的文本嵌入数据；将文本嵌入数据与语音嵌入数据合并，作为注意力机制模块的输入参数，并且将语音数据作为参考标准，训练神经网络模型；在损失函数满足预定值的情况下，得到应用于语音克隆的神经网络模型。
语音克隆模型训练方法可读存储介质

[发明专利]声音合成装置及声音合成方法-CN201780040606.X有效
发明人：久凑裕司;大道龙之介;才野庆二郎;若尔迪·博纳达;梅利因·布洛乌 -专利权人：雅马哈株式会社
申请日： 2017-06-28 - 公布日： 2023-07-21 - 主分类号： G10L13/06 文献下载
摘要：声音合成方法具有：取得步骤，依次取得与声音的合成指示对应的多个声音片段；生成步骤，通过统计模型生成与合成指示对应的统计频谱包络；以及合成步骤，将依次取得的多个声音片段相互连接，并且，与生成的统计频谱包络对应地对各声音片段的频谱包络进行变更，基于具有变更后的频谱的连接后的声音片段，对声音信号进行合成。
声音合成装置方法

[发明专利]车载语音定制系统、方法及设备-CN202310309467.3在审
发明人：高斯雄;刁楷 -专利权人：重庆长安汽车股份有限公司
申请日： 2023-03-27 - 公布日： 2023-06-27 - 主分类号： G10L13/06 文献下载
摘要：本发明实施例提供一种车载语音定制系统、方法及设备，属于智能语音交互技术领域。车载语音定制系统包括界面显示模块、信息管理模块、语音制作模块以及平台交易模块，界面显示模块，用于显示信息和识别用户操作，并基于用户操作进行对应模块的调用；信息管理模块，用于管理个性化语音包资源以及用户账号信息；语音制作模块，用于基于用户的编辑操作生成及存储个性化语音包资源；平台交易模块，用于对个性化语音包资源进行定价，并将个性化语音包资源上传至界面显示模块进行售卖。本发明实施例通过个性化制作及购买使用，实现了价值的转换，提高了用户的参与感和体验感。
车载语音定制系统方法设备

[发明专利]诗词旋律生成方法、电子装置及计算机可读存储介质-CN201811168589.0有效
发明人：梅亚琦;朱照华;刘奡智;王健宗;肖京 -专利权人：平安科技（深圳）有限公司
申请日： 2018-10-08 - 公布日： 2023-06-02 - 主分类号： G10L13/06 文献下载
摘要：本发明涉及大数据分析，提供一种诗词旋律生成方法、电子装置及计算机可读存储介质，包括：构建存储诗词样本及配乐样本的样本音乐库；提取诗词样本结构特征形成样本结构特征矩阵；提取配乐样本音高形成样本音高矩阵；构建结构特征和音高对应关系的第一概率矩阵及相邻音高之间转移关系的第二概率矩阵；构建未配乐新诗词特征矩阵；根据上述结构特征矩阵通过第一概率矩阵和第二概率矩阵生成新诗词音高序列；随机挑选配乐样本段，依次提取其音符时值，得到新诗词时值序列；通过新诗词音高序列和时值序列构建新诗词初始旋律序列；选取结构特征匹配度最高的诗词样本对应的配乐样本的旋律序列与初始旋律序列进行遗传交换操作，得到新诗词的最终旋律。
诗词旋律生成方法电子装置计算机可读存储介质

[发明专利]语音合成的迁移学习方法、装置、存储介质及电子设备-CN202211508802.4在审
发明人：汤志淼;韩亚昕;冯梦盈 -专利权人：零犀（北京）科技有限公司
申请日： 2022-11-29 - 公布日： 2023-03-31 - 主分类号： G10L13/06 文献下载
摘要：本申请的一些实施例提供了一种语音合成的迁移学习方法、装置、存储介质及电子设备，该方法包括：利用第一对象的第一语音训练集对初始模型进行训练得到第一模型；利用第二对象的第二语音训练集对所述第一模型进行训练得到目标语音模型，其中，所述目标语音模型用于将所述第一对象的语音数据合成为符合所述第二对象语音特性的数据。本申请的一些实施例可以实现语音的合成迁移。
语音合成迁移学习方法装置存储介质电子设备

[发明专利]语音克隆模型生成方法、装置及电子设备-CN202211419993.7在审
发明人：司玉景;王通;李全忠 -专利权人：普强时代（珠海横琴）信息技术有限公司
申请日： 2022-11-14 - 公布日： 2023-03-21 - 主分类号： G10L13/06 文献下载
摘要：本说明书实施例提供了一种语音克隆模型生成方法、装置及电子设备，其中，方法包括：构建包含多个说话人音色的语音合成音库；基于所述语音合成音库训练得到包含多个说话人ID的语音合成基础模型；获取目标说话人的语音和标注，从所述语音合成音库中查找到和所述目标说话人的发音相似度最高的说话人ID；在语音合成基础模型中设置该说话人的ID作为语音克隆的预训练模型，利用目标说话人的语音和标注文本，进行自适应训练，得到所述目标说话人的语音合成模型。本发明可以避免由于预训练模型和目标说话人发音差异较大而导致的语音克隆效果差的现象，进一步提高了语音克隆的合成效果和鲁棒性。
语音克隆模型生成方法装置电子设备

[发明专利]基于无人机的语音交互方法、电子设备和存储介质-CN202210688857.1在审
发明人：章国平 -专利权人：思必驰科技股份有限公司
申请日： 2022-06-16 - 公布日： 2022-09-06 - 主分类号： G10L13/06 文献下载
摘要：本发明公开一种基于无人机的语音交互方法、电子设备和存储介质。在该方法中，从控制客户端接收模式操作指令，并确定所述模式操作指令所对应的无人机工作模式；当所述无人机工作模式是通话模式时，从所述控制客户端接收通话文本数据；合成所述通话文本数据所对应的询问音频，并进行语音播报操作。由此，能有效保障与无人机通话质量的可靠性。
基于无人机语音交互方法电子设备存储介质

[发明专利]语音合成方法、装置、电子设备及存储介质-CN202210443052.0在审
发明人：任凯盟;叶剑豪;周鸿斌;鄢楷强;贺天威;贺来朋;谭芃菲;卢恒 -专利权人：上海喜马拉雅科技有限公司
申请日： 2022-04-25 - 公布日： 2022-08-05 - 主分类号： G10L13/06 文献下载
摘要：本发明涉及语音处理技术领域，提供一种语音合成方法、装置、电子设备及存储介质。通过在电子设备中预存包括声学子模型和声码器的语音合成模型和多个用户的标识及语音特征，获取目标用户输入的待处理文本并基于目标用户的标识获得目标语音特征；然后通过声学子模型基于待处理文本和目标语音特征，预测待处理文本的声学特征，该声学子模型是基于无文本标注的语音样本训练得到的；再通过声码器基于待处理文本的声学特征，生成待处理文本的合成语音。通过采用无文本标注的语音样本训练得到的声学子模型来进行语音合成，可以避免人工对语音数据进行文本标注，节省了大量的时间和人工成本，提高了语音合成的效率。
语音合成方法装置电子设备存储介质

[发明专利]一种停顿位置预测方法、语音合成方法及相关设备-CN202111339548.5在审
发明人：祖漪清;朱荣华;刘晨宁;陆晨;邵鹏飞 -专利权人：科大讯飞股份有限公司
申请日： 2021-11-12 - 公布日： 2022-03-11 - 主分类号： G10L13/06 文献下载
摘要：本申请提供了一种停顿位置预测方法、语音合成方法及相关设备，其中，停顿位置预测方法包括：获取目标文本；基于预先建立的第一词典，对目标文本进行分词，获得目标文本的分词结果，其中，第一词典中包括若干第一基本语言单元和若干第二基本语言单元，第一基本语言单元为发生连读的多个文法词组成的文法词串，第二基本语言单元为不与其他文法词发生连读的单个文法词；根据目标文本的分词结果，预测目标文本的停顿位置。经由本申请提供的停顿位置预测方法可预测出较为合理的停顿位置，根据采用本申请提供的停顿位置预测方法针对目标文本预测的停顿位置进行语音合成，能够获得效果较好的合成语音。
一种停顿位置预测方法语音合成相关设备

[发明专利]用于异常值识别以移除语音合成中的不良对准的系统和方法-CN201580082349.7有效
发明人： E·V·拉哈文达;A·甘娜帕茜拉朱 -专利权人：交互智能集团有限公司
申请日： 2015-06-11 - 公布日： 2022-01-25 - 主分类号： G10L13/06 文献下载
摘要：本发明公开了一种用于异常值识别以从语音合成中移除不良对准的系统和方法。文本‑语音系统的输出质量直接取决于语音表达的对准的精确度。由自动对准识别未对准和发音错误可以基于基频方法和基于群延迟的异常值方法做出。这些异常值的识别允许移除它们，从而提高文本‑语音系统的合成质量。
用于异常识别语音合成中的不良对准系统方法

[发明专利]将文本数据转换为音素序列的方法及设备-CN202110832833.4在审
发明人：吴志勇;宋长河;周逸轩;卞衍尧 -专利权人：腾讯科技（深圳）有限公司;清华大学深圳国际研究生院
申请日： 2021-07-22 - 公布日： 2021-12-21 - 主分类号： G10L13/06 文献下载
摘要：公开了一种将文本数据转换为音素序列的方法、装置、设备、和计算机可读存储介质。该将文本数据转换为音素序列的方法包括：基于所述文本数据中的句子，提取所述句子对应的句义特征和所述句子中的一个或多个连续字符对应的字符语义特征，基于所述句子对应的句义特征，确定所述句子对应的语法特征，基于所述字符语义特征和所述句子对应的语法特征，确定多音字特征，所述多音字特征指示字符的多音字发音信息，以及基于所述语法特征和所述多音字特征，确定所述句子对应的音素序列。本公开利用神经网络提取了文本数据中的语法特征和多音字特征并将上述的特征以级联的方式进行了融合，并可选地引入了文本数据中的变调信息，使得合成的语音更加自然。
文本数据转换音素序列方法设备

[发明专利]语音合成装置、语音合成方法及存储介质-CN201580082427.3有效
发明人：田村正统;森田真弘 -专利权人：株式会社东芝
申请日： 2015-09-16 - 公布日： 2021-12-17 - 主分类号： G10L13/06 文献下载
摘要：本公开涉及语音合成装置、语音合成方法及存储介质。实施方式的语音合成装置具有：存储部，将具有多个状态的统计模型的各状态下的、包含基音特征参数的音响特征参数的输出分布及基于时刻参数的持续长度分布作为统计模型信息进行存储；制作部，根据与输入文本对应的上下文信息及统计模型信息，制作统计模型序列；决定部，使用基于统计模型序列的各统计模型的各状态的持续长度分布而得到的持续时间长度及基于基音特征参数的输出分布而得到的基音信息，决定各状态的基音波形数；生成部，基于基音波形数来生成音响特征参数的输出分布列，基于该输出分布列来生成音响特征参数；及波形生成部，根据所生成的音响特征参数来生成语音波形。
语音合成装置方法存储介质

[发明专利]发音词典生成方法及装置、存储介质、电子设备-CN201710805626.3有效
发明人：方昕;刘俊华;魏思;胡国平 -专利权人：科大讯飞股份有限公司
申请日： 2017-09-08 - 公布日： 2021-05-04 - 主分类号： G10L13/06 文献下载
摘要：本公开提供一种发音词典生成方法及装置、存储介质、电子设备。该方法包括：获取待确定发音词语对应的语音片段，并针对所述待确定发音词语构建发音识别网络，所述发音识别网络中包括所述待确定发音词语的正确发音单元以及音变发音单元；利用所述发音识别网络对所述语音片段进行解码，确定出所述语音片段对应的发音路径，所述发音路径由所述正确发音单元和/或所述音变发音单元构成；计算所述发音路径表示的发音的置信度，并利用置信度高于预设值的发音路径表示的发音，生成所述待确定发音词语的发音词典。如此方案，可以使生成的发音词典更符合用户的实际发音，准确性更高。
发音词典生成方法装置存储介质电子设备

1
2
3
4
下一页»
尾页
共 53 条