“G10L13/02”专利分类搜索_专利查询_文献下载_出售_求购_买卖_交易

钻瓜专利网为您找到相关结果1365个，建议您升级VIP下载更多相关专利

[发明专利]音频处理方法、装置、设备及计算机可读存储介质-CN202310834406.9在审
发明人：章勤杰 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-07-07 - 公布日： 2023-10-27 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种音频处理方法、装置、设备及计算机可读存储介质，属于计算机技术领域。方法包括：获取多个音频的第一音频数据，多个第一音频数据中的至少两个第一音频数据的音频参数不同；根据标准音频参数，对所述各个音频的第一音频数据进行处理，得到所述各个音频的第二音频数据，所述第二音频数据的音频参数为所述标准音频参数；根据所述各个音频的第二音频数据，获取多个合并后的音频帧数据；对所述合并后的音频帧数据进行拼接，得到合并后的音频数据，根据所述合并后的音频数据，获取合并后的音频，所述合并后的音频包括所述多个音频。该方法能够提高音频处理的灵活性和普适性。
音频处理方法装置设备计算机可读存储介质

[发明专利]音频信号的生成方法、装置、可读存储介质和电子设备-CN202310953039.4在审
发明人：王添翼;高羽;朱宁焱 -专利权人：美的集团（上海）有限公司;美的集团股份有限公司
申请日： 2023-07-31 - 公布日： 2023-10-27 - 主分类号： G10L13/02 文献下载
摘要：本发明提供了一种音频信号的生成方法、装置、可读存储介质和电子设备，涉及音频合成技术领域。其中，音频信号的生成方法，包括：获取第一音频生成模型，第一音频生成模型包括一维卷积节点；对一维卷积节点进行编译处理，得到对应的目标机器码；根据目标机器码对第一音频生成模型进行目标处理，得到处理后的第二音频生成模型；通过第二音频生成模型生成目标音频信号。
音频信号生成方法装置可读存储介质电子设备

[发明专利]语音数据处理方法、装置、设备及计算机可读存储介质-CN202210412813.6在审
发明人：陈崇明 -专利权人： TCL科技集团股份有限公司
申请日： 2022-04-19 - 公布日： 2023-10-27 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种语音数据处理方法、装置、设备及计算机可读存储介质，方法包括：获取原始语音数据以及其对应的合成语音数据；确定原始语音数据对应的至少一个语音调整参数；根据各语音调整参数对合成语音数据进行调整，得到各语音调整参数对应的调整语音数据；根据各调整语音数据的语音质量信息，从各语音调整参数中选择目标语音调整参数。采用本申请提供的语音数据处理方法，可以有效提高合成语音的语音质量。
语音数据处理方法装置设备计算机可读存储介质

[发明专利]一种语音合成方法、装置、电子设备和存储介质-CN202311085447.9在审
发明人：丛士钧;王桂彬;贾铭 -专利权人：北京百度网讯科技有限公司
申请日： 2023-08-25 - 公布日： 2023-10-27 - 主分类号： G10L13/02 文献下载
摘要：本公开提供了一种语音合成方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及深度学习、语音处理技术领域。语音合成方法应用于配置有人工智能芯片的云端设备；云端设备预先部署多个发言人模型；人工智能芯片包括多个独立处理语音合成请求的计算核心；方法包括：接收用户发送的语音合成请求数据，并添加到缓存队列中；其中，语音合成请求数据包括至少一个目标文本片段和用户指定的目标发言人模型；并发的从缓存队列中获取目标文本片段，并将目标文本片段分别发送到不同的计算核心，使得计算核心基于目标发言人模型将目标文本片段转换成对应的语音数据。本公开方案可以提高多发言人模型场景下的语音合成效率。
一种语音合成方法装置电子设备存储介质

[发明专利]语音合成模型的训练方法、装置、设备、介质及程序产品-CN202211376239.X在审
发明人：阳珊;苏丹 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-11-04 - 公布日： 2023-10-27 - 主分类号： G10L13/02 文献下载
摘要：本申请提供了一种语音合成模型的训练方法、语音合成方法、装置、设备、存储介质及计算机程序产品；方法包括：获取文本样本以及所述文本样本对应的标准语音；通过所述语音合成模型对所述文本样本进行语音码流预测，得到所述文本样本对应的预测语音码流；通过所述语音合成模型，对所述预测语音码流进行解码，得到所述文本样本对应的预测合成语音；基于所述预测合成语音和所述标准语音间的差异，更新所述语音合成模型的模型参数，以对所述语音合成模型进行训练；通过本申请，能够提高语音合成模型的训练效率。
语音合成模型训练方法装置设备介质程序产品

[发明专利]一种基于OpenCV的中文自然场景语音识别系统-CN202311004372.7在审
发明人：门殿春;韩立群;闫劲阳;肖小娣 -专利权人：北京泰策科技有限公司
申请日： 2023-08-10 - 公布日： 2023-10-24 - 主分类号： G10L13/027 文献下载
摘要：本发明提供了一种基于OpenCV的中文自然场景语音识别系统，包括通过视觉设备进行自然场景的图像采集，获取自然场景图像；利用OpenCV对自然场景图像进行解析处理，得到自然场景图像的中文标注文本；利用大规模中文语料对中文标注文本进行处理，提取出若干自然场景关键词并组合成自然场景关键词文本；对自然场景关键词文本进行语音合成，生成自然场景描述语音。本发明可以实现对自然场景中不同的行为、设备、环境信息等等具体的场景信息进行标注，通过关键词进行文本化解析，生成具体文本化的内容，通过文本化的内容，可以通过语音转化的方式，将文本转化为语音，从而实现自然场景的语音描述。
一种基于 opencv 中文自然场景语音识别系统

[发明专利]定制声音的合成方法、装置、电子设备及存储介质-CN202310961831.4在审
发明人：王茜;冯小琴;陈云琳 -专利权人：上海墨百意信息科技有限公司
申请日： 2023-08-01 - 公布日： 2023-10-24 - 主分类号： G10L13/02 文献下载
摘要：本公开提供了一种定制声音的合成方法，包括：对历史音频数据进行分析，构建关于声音维度的定制提示数据库，其中定制提示数据库包括多个定制标签及各个定制标签所对应的多种自然语言标注；调用标签生成模型对定制指令进行分析，以在定制提示数据库中确定关于定制指令的多个目标标签及相应目标标注；以及基于各个目标标签及相应目标标注，将目标文本转换为响应定制指令的定制声音。本公开还提供一种定制声音的合成装置、电子设备及存储介质。
定制声音合成方法装置电子设备存储介质

[发明专利]基于离散化自监督表征增强的非自回归建模方法-CN202310933874.1在审
发明人：高盛祥;冯子健;余正涛 -专利权人：昆明理工大学
申请日： 2023-07-27 - 公布日： 2023-10-24 - 主分类号： G10L13/02 文献下载
摘要：本发明涉及基于离散化自监督表征增强的非自回归建模方法，属于自然语言处理技术领域。本发明首先结合老挝语的语言语音特点，在老挝语音素粒度上标注时长信息，其次使用非自回归架构建模声学模型，避免数据稀缺情况下自回归模型注意力机制泛化能力差的问题。通过自监督学习的预训练语音模型来提取语音内容和声调信息的离散化表征，融入到声学模型中增强模型的语音生成能力，增强合成音频的流畅性和自然性。本发明提出的基于离散化自监督表征增强的非自回归建模方法，能更好的在声调、音素时长、音高等细粒度层面刻画老挝语的语音特性。
基于离散监督表征增强回归建模方法

[发明专利]语音合成方法、装置及服务器-CN202010437019.8有效
发明人：林诗伦;蒙力;苏文超;唐宗尧;李新辉;卢鲤 -专利权人：腾讯科技（深圳）有限公司
申请日： 2020-05-21 - 公布日： 2023-10-24 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种语音合成方法、装置及服务器，涉及人工智能技术领域。其中，该方法包括：获得针对语音合成模型的性能要求信息；根据性能要求信息，分别确定与性能要求信息对应的目标编码器、目标注意力组件和目标解码器；获得包括目标编码器、目标注意力组件和目标解码器的目标语音合成模型；通过目标语音合成模型将接收的字符信息合成为语音信息。如此，可以根据性能要求的不同来获得对应的语音合成模型，从而基于该语音合成模型提供符合该性能要求的语音合成服务。
语音合成方法装置服务器

[发明专利]语音处理方法及装置、计算机可读的存储介质、电子装置-CN202010682292.7有效
发明人：陈帅 -专利权人：青岛海尔科技有限公司
申请日： 2020-07-15 - 公布日： 2023-10-24 - 主分类号： G10L13/02 文献下载
摘要：本发明提供了一种语音处理方法及装置、计算机可读的存储介质、电子装置，其中，语音处理方法包括：获取第一终端发送的第一语音信息，并将所述第一语音信息与预设的一个或多个目标感情信息叠加以生成一个或多个第二语音信息；发送所述第一语音信息或所述第二语音信息至第二终端。通过本发明实施例，可以解决相关技术中，用户发送的语音无法表达用户期望的情感进而导致用户体验不佳的问题，以令用户发送的语音可真实表达用户期望的情感，进而改善了语音功能实现的用户体验。
语音处理方法装置计算机可读存储介质电子

[发明专利]虚拟语音的生成方法-CN202310916039.7在审
发明人：李昌绿;詹楚伟;朱正辉 -专利权人：广东保伦电子股份有限公司
申请日： 2023-07-24 - 公布日： 2023-10-20 - 主分类号： G10L13/02 文献下载
摘要：本发明涉及语音处理技术领域，尤其涉及一种虚拟语音的生成方法，包括：步骤S1、生成虚拟语音，检测虚拟语音的声波形状，中控模块根据的声波形状计算相似度；步骤S2、评级，判定所述虚拟语音的生成是否合格；步骤S3、所述中控模块在判定所述虚拟语音的生成不符合标准时判定是否更新测试语句，或，将降噪处理过程中反相位声波的频率和幅度调节至对应值；步骤S4、所述中控模块在判定所述虚拟语音的生成符合标准时二次判定所述虚拟语音的生成是否合格，本发明避免了生成的虚拟语音漏词的现象，提高了生成的虚拟语音的质量，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。
虚拟语音生成方法

[发明专利]语音合成方法、装置、电子设备及可读存储介质-CN202310531650.8在审
发明人：刘莹;高莹莹;张世磊;雷怡;李函昭;谢磊 -专利权人：中国移动通信有限公司研究院;中国移动通信集团有限公司
申请日： 2023-05-11 - 公布日： 2023-10-20 - 主分类号： G10L13/027 文献下载
摘要：本申请提供一种语音合成方法、装置、电子设备及可读存储介质。所述方法包括：获取待合成文本的每个音频片段的情感强度，每个所述音频片段分别对应所述待合成文本的一个音节，所述情感强度是音素级的情感强度；根据所述情感强度以及声学模型，获得所述待合成文本对应的梅尔频谱；基于所述梅尔频谱生成语音。本申请的实施例，获取待合成文本的每个音频片段的情感强度，声学模型基于情感强度获得所述待合成文本对应的梅尔频谱；基于所述梅尔频谱生成语音。其中的音频频段是每个音节对应的音频片段，获得的情感强度是音素级的情感强度，实现了细粒度情感可控的语音合成，合成的语音具有的情感更加准确。
语音合成方法装置电子设备可读存储介质

[发明专利]模型训练方法、声学模型、语音合成系统和电子设备-CN202210957709.5有效
发明人：龚雪飞 -专利权人：荣耀终端有限公司
申请日： 2022-08-10 - 公布日： 2023-10-20 - 主分类号： G10L13/02 文献下载
摘要：本申请涉及语音处理技术领域，公开了一种模型训练方法、声学模型、语音合成系统和电子设备；方法包括：获取第一模型，将输入数据输入第一模型进行处理，获取输入数据对应的第一模型输出结果；获取输入数据对应的预设标准输出结果；基于第一模型输出结果和预设标准输出结果对第一模型进行优化，获取第二模型，第二模型包括第一后处理网络；确定第一后处理网络中各通道的重要性；基于各通道的重要性对第一后处理网络中的部分通道进行裁剪，以获取第二后处理网络，并且基于第二后处理网络获得第三模型；在确定第三模型满足模型要求的情况下，将第三模型作为最终训练模型。基于上述方案，能够在保证模型性能的同时有效减小模型的占用内存。
模型训练方法声学语音合成系统电子设备

[发明专利]一种语音合成方法及装置-CN202110941865.8有效
发明人：张句;贡诚;王宇光;关昊天 -专利权人：慧言科技（天津）有限公司
申请日： 2021-08-17 - 公布日： 2023-10-20 - 主分类号： G10L13/02 文献下载
摘要：本申请提供一种语音合成方法及装置，涉及音频技术领域，能够提升语音合成的实时率，并且能够提升所合成的语音的音质。该方法包括：基于第一训练样本集和教师声学模型，对预设学生声学模型进行训练，得到目标学生声学模型，该第一训练样本集包括多个文本和该多个文本对应的声学特征，该预设学生声学模型为轻量级的声学模型；并且采用目标学生声学模型对目标文本进行特征提取，得到目标文本的声学特征；以及通过声码器对目标文本的声学特征进行处理，得到目标文本对应的语音。其中，教师声学模型、预设学生声学模型以及目标学生声学模型均用于提取文本的声学特征。
一种语音合成方法装置

[发明专利]一种低资源下利用迁移学习进行情感语音合成的方法-CN202010681019.2有效
发明人：王龙标;徐杰;党建武;贡诚 -专利权人：天津大学
申请日： 2020-07-15 - 公布日： 2023-10-17 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种低资源下利用迁移学习进行情感语音合成的方法，包括以下步骤：步骤一，情感向量预训练：利用EMOV‑DB数据集对于一个语音情感识别模型进行训练，这一语音情感识别模型是由风格化端到端语音合成的基本方法GST+Tacotron2模型中风格向量提取部分进一步处理得到的；步骤二，语音合成模型预训练：对于基本的Tacotron2模型，利用LJSpeech‑1.1的数据集进行预训练；步骤三，进行迁移学习训练：对于基本的Tacotron2模型在编码器的结果上连接上步骤一中得到的中间结果，并进行迁移学习训练。本发明采用预训练和迁移学习的方法，能够充分利用单个说话人少量的情感数据，在一个统一的情感语音合成模型的基础上，合成出质量达到一定水平的、情感倾向明显的合成语音。
一种资源利用迁移学习进行情感语音合成方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
下一页»
尾页
共 1365 条