[发明专利]一种低功耗的自定义唤醒词语音识别系统及方法在审
申请号: | 202011057902.0 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112331189A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 刘玲;欧阳鹏;尹首一 | 申请(专利权)人: | 江苏清微智能科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/01 |
代理公司: | 北京索睿邦知识产权代理有限公司 11679 | 代理人: | 李根 |
地址: | 211100 江苏省南京市江宁区麒麟*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 功耗 自定义 唤醒 词语 识别 系统 方法 | ||
本发明公开一种低功耗的自定义唤醒词语音识别系统及方法,属于自定义语音唤醒识别技术领域。包括:语音数据采集模块、声学特征提取模块、唤醒词检测模块、自定义唤醒词模块、预置字典模块、发音字典生成器、字典生成器、语言模型生成器、解码图生成器、深度学习模型、通用声学模型和解码器。当设备需要自定义唤醒词时,通过自定义唤醒词模块接收唤醒词后输出自定义唤醒词表,通过解码图生成器生成静态解码图,通过解码器将静态解码图和通用声学模型解码判断是否含有激活词。本发明解决了现有技术中唤醒词需要海量的数据作为训练数据,且无法满足用户个性化需求的问题。
技术领域
本发明属于自定义语音唤醒识别技术领域,尤其涉及一种低功耗的自定义唤醒词语音识别系统及方法。
背景技术
现有的智能音箱,在待机状态下,以较低的功耗持续监听周围的环境,用户通过唤醒词能够将设备从休眠状态中唤醒,并作出指定响应。但当不同设备是一个唤醒词时,一个唤醒词便能够同时唤醒多个设备,对用户的使用造成了极大的不便。
唤醒词往往需要大量的训练数据才可以生成有效的模型,保证唤醒率。现有的静态解码存在的内存占用率较大的问题,无法用于芯片这种对内存要求比较高的场景。
发明内容
本发明的目的是提供一种低功耗的自定义唤醒词语音识别系统及方法,以解决现有技术中唤醒词需要海量的数据作为训练数据,且无法满足用户个性化需求的问题。
为了实现上述目的,本发明提供如下技术方案:
一种低功耗的自定义唤醒词语音识别方法,包括:
S101,一个语音数据采集模块,通过语音数据采集模块采集操作人员发出的唤醒词。
S102,一个声学特征提取模块,其配置为能够接收语音数据采集模块采集的唤醒词,通过声学特征提取模块提取唤醒词的特征信息。
S103,一个唤醒词检测模块,其能够接收特征信息,根据特征信息判断唤醒词是否是自定义唤醒词。若是,则输出唤醒词。
S104,一个自定义唤醒词模块,其能够接收唤醒词,自定义唤醒词模块能够输出自定义唤醒词表。
S105,一个预置字典模块。
S106,一个发音字典生成器,其能够接收接收自定义唤醒词表,发音字典生成器能够根据接收到的自定义唤醒词表和预置字典模块生成一个发音字典。
S107,一个字典生成器,其配置为接收发音字典,字典生成器能够根据发音字典生成一个字典。
S108,一个语言模型生成器,其配置为能够接收字典生成器输出的新字典。语言模型生成器能够根据字典生成一个语言模型。
S109,一个解码图生成器,其配置为能够接收语言模型和发音字典。解码图生成器接收语言模型和发音字典能够生成一个静态解码图。
S110,一个通用声学模型。
S111,一个解码器,其能够接收静态解码图和通用声学模型,解码器能够将接收到的静态解码图和通用声学模型解码,并判断语音数据是否含有激活词。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步地,若唤醒词检测模块的判断结果为否。解码器根据静态解码图和通用声学模型判断是否含有激活词。
进一步地,还包括一个深度学习模型,深度学习模型不大于300KB。
进一步地,深度学习模型能够接收声学特征提取模块输出的特征向量。通过深度学习模型训练声学模型。
进一步地,一个语音数据采集模块,通过语音数据采集模块采集操作人员发出的唤醒词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏清微智能科技有限公司,未经江苏清微智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011057902.0/2.html,转载请声明来源钻瓜专利网。