[发明专利]具有童声判别的语音识别模型、方法、装置及存储介质在审
| 申请号: | 202210517274.2 | 申请日: | 2022-05-12 |
| 公开(公告)号: | CN114974216A | 公开(公告)日: | 2022-08-30 |
| 发明(设计)人: | 郎芬玲;崔潇潇 | 申请(专利权)人: | 北京探境科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22;G10L25/51 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李静玉 |
| 地址: | 100094 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种具有童声判别的语音识别模型、方法、装置及存储介质,该模型包括:具有编码器、解码器和线性输出部分的transformer模型和全连接网络,transformer模型为语音识别的基础模型,全连接网络接收编码器的输出进行童声判别特征提取,输出童声判别结果;或者,包括:具有编码器、解码器和线性输出部分的transformer模型和全连接网络,transformer模型为语音识别的基础模型,全连接网络接收编码器的输出进行童声判别特征提取,将提取的童声判别特征输出至解码器进行童声判别。通过实施本发明,构建的模型不仅能实现语音识别功能,还能识别是否为童声,节省了资源,降低算力。 | ||
| 搜索关键词: | 具有 童声 别的 语音 识别 模型 方法 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京探境科技有限公司,未经北京探境科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210517274.2/,转载请声明来源钻瓜专利网。





