专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1365个,建议您升级VIP下载更多相关专利
  • [发明专利]音频处理方法、装置、设备及计算机可读存储介质-CN202310834406.9在审
  • 章勤杰 - 腾讯科技(深圳)有限公司
  • 2023-07-07 - 2023-10-27 - G10L13/02
  • 本申请公开了一种音频处理方法、装置、设备及计算机可读存储介质,属于计算机技术领域。方法包括:获取多个音频的第一音频数据,多个第一音频数据中的至少两个第一音频数据的音频参数不同;根据标准音频参数,对所述各个音频的第一音频数据进行处理,得到所述各个音频的第二音频数据,所述第二音频数据的音频参数为所述标准音频参数;根据所述各个音频的第二音频数据,获取多个合并后的音频帧数据;对所述合并后的音频帧数据进行拼接,得到合并后的音频数据,根据所述合并后的音频数据,获取合并后的音频,所述合并后的音频包括所述多个音频。该方法能够提高音频处理的灵活性和普适性。
  • 音频处理方法装置设备计算机可读存储介质
  • [发明专利]一种语音合成方法、装置、电子设备和存储介质-CN202311085447.9在审
  • 丛士钧;王桂彬;贾铭 - 北京百度网讯科技有限公司
  • 2023-08-25 - 2023-10-27 - G10L13/02
  • 本公开提供了一种语音合成方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及深度学习、语音处理技术领域。语音合成方法应用于配置有人工智能芯片的云端设备;云端设备预先部署多个发言人模型;人工智能芯片包括多个独立处理语音合成请求的计算核心;方法包括:接收用户发送的语音合成请求数据,并添加到缓存队列中;其中,语音合成请求数据包括至少一个目标文本片段和用户指定的目标发言人模型;并发的从缓存队列中获取目标文本片段,并将目标文本片段分别发送到不同的计算核心,使得计算核心基于目标发言人模型将目标文本片段转换成对应的语音数据。本公开方案可以提高多发言人模型场景下的语音合成效率。
  • 一种语音合成方法装置电子设备存储介质
  • [发明专利]一种基于OpenCV的中文自然场景语音识别系统-CN202311004372.7在审
  • 门殿春;韩立群;闫劲阳;肖小娣 - 北京泰策科技有限公司
  • 2023-08-10 - 2023-10-24 - G10L13/027
  • 本发明提供了一种基于OpenCV的中文自然场景语音识别系统,包括通过视觉设备进行自然场景的图像采集,获取自然场景图像;利用OpenCV对自然场景图像进行解析处理,得到自然场景图像的中文标注文本;利用大规模中文语料对中文标注文本进行处理,提取出若干自然场景关键词并组合成自然场景关键词文本;对自然场景关键词文本进行语音合成,生成自然场景描述语音。本发明可以实现对自然场景中不同的行为、设备、环境信息等等具体的场景信息进行标注,通过关键词进行文本化解析,生成具体文本化的内容,通过文本化的内容,可以通过语音转化的方式,将文本转化为语音,从而实现自然场景的语音描述。
  • 一种基于opencv中文自然场景语音识别系统
  • [发明专利]基于离散化自监督表征增强的非自回归建模方法-CN202310933874.1在审
  • 高盛祥;冯子健;余正涛 - 昆明理工大学
  • 2023-07-27 - 2023-10-24 - G10L13/02
  • 本发明涉及基于离散化自监督表征增强的非自回归建模方法,属于自然语言处理技术领域。本发明首先结合老挝语的语言语音特点,在老挝语音素粒度上标注时长信息,其次使用非自回归架构建模声学模型,避免数据稀缺情况下自回归模型注意力机制泛化能力差的问题。通过自监督学习的预训练语音模型来提取语音内容和声调信息的离散化表征,融入到声学模型中增强模型的语音生成能力,增强合成音频的流畅性和自然性。本发明提出的基于离散化自监督表征增强的非自回归建模方法,能更好的在声调、音素时长、音高等细粒度层面刻画老挝语的语音特性。
  • 基于离散监督表征增强回归建模方法
  • [发明专利]虚拟语音的生成方法-CN202310916039.7在审
  • 李昌绿;詹楚伟;朱正辉 - 广东保伦电子股份有限公司
  • 2023-07-24 - 2023-10-20 - G10L13/02
  • 本发明涉及语音处理技术领域,尤其涉及一种虚拟语音的生成方法,包括:步骤S1、生成虚拟语音,检测虚拟语音的声波形状,中控模块根据的声波形状计算相似度;步骤S2、评级,判定所述虚拟语音的生成是否合格;步骤S3、所述中控模块在判定所述虚拟语音的生成不符合标准时判定是否更新测试语句,或,将降噪处理过程中反相位声波的频率和幅度调节至对应值;步骤S4、所述中控模块在判定所述虚拟语音的生成符合标准时二次判定所述虚拟语音的生成是否合格,本发明避免了生成的虚拟语音漏词的现象,提高了生成的虚拟语音的质量,在保证虚拟语音的质量的同时,提高了虚拟语音生成的效率。
  • 虚拟语音生成方法
  • [发明专利]模型训练方法、声学模型、语音合成系统和电子设备-CN202210957709.5有效
  • 龚雪飞 - 荣耀终端有限公司
  • 2022-08-10 - 2023-10-20 - G10L13/02
  • 本申请涉及语音处理技术领域,公开了一种模型训练方法、声学模型、语音合成系统和电子设备;方法包括:获取第一模型,将输入数据输入第一模型进行处理,获取输入数据对应的第一模型输出结果;获取输入数据对应的预设标准输出结果;基于第一模型输出结果和预设标准输出结果对第一模型进行优化,获取第二模型,第二模型包括第一后处理网络;确定第一后处理网络中各通道的重要性;基于各通道的重要性对第一后处理网络中的部分通道进行裁剪,以获取第二后处理网络,并且基于第二后处理网络获得第三模型;在确定第三模型满足模型要求的情况下,将第三模型作为最终训练模型。基于上述方案,能够在保证模型性能的同时有效减小模型的占用内存。
  • 模型训练方法声学语音合成系统电子设备
  • [发明专利]一种语音合成方法及装置-CN202110941865.8有效
  • 张句;贡诚;王宇光;关昊天 - 慧言科技(天津)有限公司
  • 2021-08-17 - 2023-10-20 - G10L13/02
  • 本申请提供一种语音合成方法及装置,涉及音频技术领域,能够提升语音合成的实时率,并且能够提升所合成的语音的音质。该方法包括:基于第一训练样本集和教师声学模型,对预设学生声学模型进行训练,得到目标学生声学模型,该第一训练样本集包括多个文本和该多个文本对应的声学特征,该预设学生声学模型为轻量级的声学模型;并且采用目标学生声学模型对目标文本进行特征提取,得到目标文本的声学特征;以及通过声码器对目标文本的声学特征进行处理,得到目标文本对应的语音。其中,教师声学模型、预设学生声学模型以及目标学生声学模型均用于提取文本的声学特征。
  • 一种语音合成方法装置
  • [发明专利]一种低资源下利用迁移学习进行情感语音合成的方法-CN202010681019.2有效
  • 王龙标;徐杰;党建武;贡诚 - 天津大学
  • 2020-07-15 - 2023-10-17 - G10L13/02
  • 本发明公开了一种低资源下利用迁移学习进行情感语音合成的方法,包括以下步骤:步骤一,情感向量预训练:利用EMOV‑DB数据集对于一个语音情感识别模型进行训练,这一语音情感识别模型是由风格化端到端语音合成的基本方法GST+Tacotron2模型中风格向量提取部分进一步处理得到的;步骤二,语音合成模型预训练:对于基本的Tacotron2模型,利用LJSpeech‑1.1的数据集进行预训练;步骤三,进行迁移学习训练:对于基本的Tacotron2模型在编码器的结果上连接上步骤一中得到的中间结果,并进行迁移学习训练。本发明采用预训练和迁移学习的方法,能够充分利用单个说话人少量的情感数据,在一个统一的情感语音合成模型的基础上,合成出质量达到一定水平的、情感倾向明显的合成语音。
  • 一种资源利用迁移学习进行情感语音合成方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top