[发明专利]具有童声判别的语音识别模型、方法、装置及存储介质在审
| 申请号: | 202210517274.2 | 申请日: | 2022-05-12 |
| 公开(公告)号: | CN114974216A | 公开(公告)日: | 2022-08-30 |
| 发明(设计)人: | 郎芬玲;崔潇潇 | 申请(专利权)人: | 北京探境科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/22;G10L25/51 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李静玉 |
| 地址: | 100094 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 具有 童声 别的 语音 识别 模型 方法 装置 存储 介质 | ||
本发明公开了一种具有童声判别的语音识别模型、方法、装置及存储介质,该模型包括:具有编码器、解码器和线性输出部分的transformer模型和全连接网络,transformer模型为语音识别的基础模型,全连接网络接收编码器的输出进行童声判别特征提取,输出童声判别结果;或者,包括:具有编码器、解码器和线性输出部分的transformer模型和全连接网络,transformer模型为语音识别的基础模型,全连接网络接收编码器的输出进行童声判别特征提取,将提取的童声判别特征输出至解码器进行童声判别。通过实施本发明,构建的模型不仅能实现语音识别功能,还能识别是否为童声,节省了资源,降低算力。
技术领域
本发明涉及人工智能技术领域,具体涉及一种具有童声判别的语音识别模型、方法、装置及存储介质。
背景技术
随着人工智能飞速发展,产品多样化出现了极大的提高。各种各样基于语音交互的智能设备也进入到了千家万户,而语音交互智能设备的出现也使得这些智能设备能够被儿童所控制。为了避免儿童对智能设备的误操作,越来越多的智能设备中增加了“童锁”的功能。该避免了儿童因好奇误操作而导致的危险。
传统的大多数智能设备都是通过按键或者密码方式启动童锁。在童锁开启的时候,通过增加操作复杂度来避免儿童误操作,例如必须解锁童锁按键后,其他功能按键才能有效。而对于基于语音交互的智能设备,大部分按钮功能已经升级为语音控制,无法通过按键设置来实现童锁功能。另一方面,从声音信息中分析出是否为童音,不需要额外的操作,会极大提升用户体验。所以通过声音来判别童声就成了智能语音控制设备上童锁功能实现的关键技术。
然而,在目前的基于语音交互的智能设备中,语音识别算法和童声判别算法均采用单独的算法模型进行语音识别和童声判别,大大提高了智能设备的计算量,增加了时间和算力的成本。
发明内容
有鉴于此,本发明实施例提供了涉及一种具有童声判别的语音识别模型、方法、装置及存储介质,以解决现有技术中语音识别算法和童声判别算法均采用单独的算法模型进行语音识别和童声判别,大大提高了智能设备的计算量的技术问题。
本发明提出的技术方案如下:
本发明实施例第一方面提供一种具有童声判别的语音识别模型,包括:transformer模型和全连接网络,所述transformer模型包括编码器、解码器和线性输出部分,所述transformer模型为语音识别的基础模型,所述全连接网络的输入端连接所述编码器的第一输出端,所述编码器的第二输出端连接所述解码器的输入端,所述全连接网络用于进行童声判别特征提取,输出童声判别结果;或者,包括:transformer模型和全连接网络,所述transformer模型包括编码器、解码器和线性输出部分,所述transformer模型为语音识别的基础模型,所述全连接网络的输入端连接所述编码器的第一输出端,所述编码器的第二输出端连接所述解码器的输入端,所述全连接网络用于进行童声判别特征提取,将提取的童声判别特征输出至所述解码器进行童声判别。
可选地,所述全连接网络为二维输出或多维输出,当所述全连接网络为二维输出时,所述全连接网络提取童声判别特征后,根据童声判别特征进行童声识别;当所述全连接网络为多维输出时,所述全连接网络提取童声判别特征后,将所述童声判别特征输入至所述解码器,所述解码器和所述线性输出部分根据所述童声判别特征进行童声识别。
可选地,所述具有童声判别的语音识别模型的参数根据批量梯度下降算法更新;所述具有童声判别的语音识别模型的损失函数采用如下公式计算:
L=LossCE+β*LossBCE
式中,lossCE表示语音识别损失函数,lossBCE表示童声判别损失函数,β表示权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京探境科技有限公司,未经北京探境科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210517274.2/2.html,转载请声明来源钻瓜专利网。





