[发明专利]支持多唤醒词的说话人识别神经网络模型的训练方法、说话人识别方法及系统有效
| 申请号: | 202010032282.9 | 申请日: | 2020-01-13 |
| 公开(公告)号: | CN111243604B | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 项煦;黄厚军;钱彦旻 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/08;G10L17/18;G10L15/22;G10L15/16;G10L15/06;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;李彬彬 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开一种支持多唤醒词的说话人识别方法,其包括构建用于说话人识别的神经网络模型,并对构建的神经网络模型进行训练;对注册音频,利用训练好的神经网络模型的主干部分提取出其对应的中间表示存储;在获取到实时音频数据时,通过训练好的神经网络模型提取出实时音频数据的中间表示,并将其与注册音频的中间表示进行对比,以确定实时音频的说话人与注册音频是否相同。根据本发明公开的方案不但能够实现支持多唤醒词的说话人识别,而且能够避免针对不同的唤醒词均收集很多训练数据的限制,同时也避免了训练和存储多个模型的弊端,实现多个唤醒词共用一个神经网络模型进行准确的说话人识别,降低了多个特定唤醒词说话人识别系统的实现成本。 | ||
| 搜索关键词: | 支持 唤醒 说话 识别 神经网络 模型 训练 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010032282.9/,转载请声明来源钻瓜专利网。
- 上一篇:长寿命空气压缩机油组合物
- 下一篇:一种基于云管平台的自动回归测试方法





