[发明专利]唤醒词评估方法及装置、存储介质、电子设备有效
申请号: | 201810159653.2 | 申请日: | 2018-02-26 |
公开(公告)号: | CN108536668B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 吴国兵;潘嘉;王海坤 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/216;G06F16/36;G10L15/02;G10L15/26 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 评估 方法 装置 存储 介质 电子设备 | ||
本公开提供一种唤醒词评估方法及装置、存储介质、电子设备。该方法包括:获取用户输入的待评估词语;提取所述待评估词语的评估特征,所述评估特征用于表示所述待评估词语在声学层面和/或语义层面的区分性;将所述待评估词语的评估特征作为输入,经预先构建的唤醒词评估模型处理后,确定所述待评估词语是否适合作为唤醒词。如此方案,有助于提高唤醒词评估结果的准确性,进而提高用户设置的唤醒词的唤醒效果。
技术领域
本公开涉及语音信号处理技术领域,具体地,涉及一种唤醒词评估方法及装置、存储介质、电子设备。
背景技术
语音唤醒技术是语音信号处理技术领域的重要分支,在智能家居、智能机器人、智能车机、智能手机等方面有着重要的应用。
在实际应用过程中,智能终端捕捉用户输入的语音数据,由预先构建的唤醒模型进行唤醒词识别,若该语音数据被识别为唤醒词,则唤醒成功;否则唤醒失败。
为了提高用户的使用体验,可以由用户根据需求设置个性化的唤醒词。同时,为了确保唤醒效果,在用户设置唤醒词时需要先进行唤醒词评估,判断用户设置的唤醒词是否合适。
目前的唤醒词评估主要依据经验或者规则实现。具体地,可以获取用户设置的待评估词语,判断待评估词语是否满足预设评估条件,如果满足,则说明待评估词语适合作为唤醒词。举例来说,预设评估条件可以包括:词语的长度超过预设长度;和/或,词语包括的音节之间的差异大于预设差异。其中,词语的长度可以体现为词语包括的文字数量和/或词语对应的语音数据的音频时长;音节之间的差异可以体现为相邻音节是否相同,进而统计出不同相邻音节的数量,与预设差异相比较。
如此基于经验或者规则实现的唤醒词评估过程,由于规则设置具有一定的主观性,致使评估结果准确性较低,进而影响用户设置的唤醒词的唤醒效果。
发明内容
本公开的主要目的是提供一种唤醒词评估方法及装置、存储介质、电子设备,有助于提高唤醒词评估结果的准确性,进而提高用户设置的唤醒词的唤醒效果。
为了实现上述目的,本公开提供一种唤醒词评估方法,所述方法包括:
获取用户输入的待评估词语;
提取所述待评估词语的评估特征,所述评估特征用于表示所述待评估词语在声学层面和/或语义层面的区分性;
将所述待评估词语的评估特征作为输入,经预先构建的唤醒词评估模型处理后,确定所述待评估词语是否适合作为唤醒词。
可选地,用于表示所述待评估词语在声学层面的区分性的评估特征包括语音单元的分布特征,则所述提取所述待评估词语的评估特征包括:分析所述待评估词语包括的语音单元,统计语音单元的总数目、不同语音单元的数目、各不同语音单元出现的次数、指定语音单元的数目、各指定语音单元出现的次数中的至少一项,作为所述语音单元的分布特征;
和/或,
用于表示所述待评估词语在声学层面的区分性的评估特征包括待评估词语的识别概率,则所述提取所述待评估词语的评估特征包括:获取所述待评估词语包括的语音单元的识别概率;将各语音单元的识别概率的均值,作为所述待评估词语的识别概率,所述识别概率包括准确率和/或虚警率;
和/或,
用于表示所述待评估词语在声学层面的区分性的评估特征包括待评估词语的时长,则所述提取所述待评估词语的评估特征包括:获取所述待评估词语包括的语音单元的时长;将各语音单元的时长之和,作为所述待评估词语的时长;
和/或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810159653.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:中文文本识别方法及装置
- 下一篇:文字信息处理方法、装置及终端