[发明专利]用于离线语音识别的实时生成解码文件的系统和方法在审
申请号: | 202010323145.0 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111724768A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 丁伟;谢世波;高亚龙;吴学伟;宋继海 | 申请(专利权)人: | 深圳市伟文无线通讯技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/26;G10L15/28;G10L15/30;G10L17/24 |
代理公司: | 深圳市深可信专利代理有限公司 44599 | 代理人: | 万永泉 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 离线 语音 识别 实时 生成 解码 文件 系统 方法 | ||
本发明公开了一种用于离线语音识别的实时生成解码文件的系统和方法,涉及语音识别中的生成解码文件领域;该系统包含命令词定义模块、命令词发音审核模块、串口命令定义模块、命令词门限定义模块、播报音配置模块五大模块和模型生成服务、用户管理服务两大服务;整体的实施方法步骤如下:首先命令词和发音的确定,接着是串口、门限、播报音的确定,最后是调用模型生成服务生成需要的解码镜像,下载镜像到板子并上电即可完成所有操作。本发明解决离线语音识别中从命令词定义到给客户语音版本耗时长、命令词无法调整、普通研发人员无法介入工作的问题。
技术领域
本发明涉及语音识别中的生成解码文件领域,提供了一种用于离线语音识别的实时生成解码文件的系统和方法。
背景技术
目前对于控制类的离线语音识别,要得到完整的解码文件,需要进行多个步骤才能完成:1、专业人士采集上千人语料、对语料进行审核,去掉残缺语料;2、处理语料,把采集的语料转化为可训练的语料,经过多个小时训练生成解码模型,在识别率不满足要求时可能要迭代多次训练;3、根据模型特点设置词条的门限值,降低误识别的概率;4、待解码模型确定后,再人工生成播报音;5、最后根据解码模型、命令词、播报音来配置关联文件。
从上面可以看出,从客户提出命令词到最终生成解码文件,需要语音识别的专业人士多次操作,按照步骤一步步的才能完成,非专业人员无法完成该类工作,并且从命令词定义好到最后出版本至少需要两周以上的时间。
发明内容
本发明提供一种用于离线语音识别的实时生成解码文件的系统和方法,是解决离线语音识别中从命令词定义到给客户语音版本耗时长、命令词无法调整、普通研发人员无法介入工作的问题而提供的一种新型的训练系统和方法。
本发明解决其技术问题所采用的技术方案是:一种用于离线语音识别的实时生成解码文件的系统,包括:
1)命令词定义模块,该模块提供了唤醒词和命令词的定义以及词条检测功能;
2)命令词发音审核模块,该模块显示词条发音和修改词条发音;
3)串口命令定义模块,该模块定义命令词与系统之间的交互关系;
4)命令词门限定义模块,该模块定义命令词的门限值;
5)播报音配置模块,该模块设置识别出命令词后提示客户的播报音;
6)模型生成服务模块,该服务模块是根据上述五个模块提供的内容生成解码文件的服务模块;
7)用户管理服务模块,该服务模块包括用户的注册、审核、登录、删除相关的服务模块。
进一步地,所述词条检测功能包括词的相似度检测、词的发音检测,对于不满足条件的词给出警告提醒。
进一步地,所述命令词发音审核模块会根据系统定义的词条生成每个词的发音,发音内容会显示到界面上;还包括人工检查和审核,对发现不正确的发音进行修改。
进一步地,所述串口命令定义模块显示出定义的词条,在词条后面设有输入框,用于输入当出现该词条时发什么命令给系统;输入的命令系统会有检查功能,不可随意输入。
进一步地,对于所述命令词门限定义模块,每个识别出来的命令词都有一个可信度的值,当命令词可信度值大于等于设置的门限值时命令词有效,小于该门限值则被系统丢弃。
进一步地,所述播报音配置模块会让用户选择提示音的类型,每种类型有试听功能;所述播报音配置模块对上电后的播报音、唤醒词的播报音以及每个命令词的播报音都需要设置,设置的内容由用户手动输入,所述播报音配置模块在后台生成播放的语音文件。
进一步地,所述模型生成服务模块包括语音识别的解码模型生成、解码配置文件生成以及业务文件生成,并把所述一堆文件打包成镜像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市伟文无线通讯技术有限公司,未经深圳市伟文无线通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010323145.0/2.html,转载请声明来源钻瓜专利网。