[发明专利]唤醒词评估方法及装置、存储介质、电子设备有效
申请号: | 201810159653.2 | 申请日: | 2018-02-26 |
公开(公告)号: | CN108536668B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 吴国兵;潘嘉;王海坤 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/216;G06F16/36;G10L15/02;G10L15/26 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 评估 方法 装置 存储 介质 电子设备 | ||
1.一种唤醒词评估方法,其特征在于,所述方法包括:
获取用户输入的待评估词语;
提取所述待评估词语的评估特征,所述评估特征用于表示所述待评估词语在声学层面和/或语义层面的区分性,用于表示所述待评估词语在声学层面的区分性的评估特征包括语音单元的分布特征、待评估词语的识别概率、待评估词语的时长和待评估词语的音调特征;
将所述待评估词语的评估特征作为输入,经预先构建的唤醒词评估模型处理后,确定所述待评估词语是否适合作为唤醒词。
2.根据权利要求1所述的方法,其特征在于,
用于表示所述待评估词语在声学层面的区分性的评估特征包括语音单元的分布特征,则所述提取所述待评估词语的评估特征包括:分析所述待评估词语包括的语音单元,统计语音单元的总数目、不同语音单元的数目、各不同语音单元出现的次数、指定语音单元的数目、各指定语音单元出现的次数中的至少一项,作为所述语音单元的分布特征;
和/或,
用于表示所述待评估词语在声学层面的区分性的评估特征包括待评估词语的识别概率,则所述提取所述待评估词语的评估特征包括:获取所述待评估词语包括的语音单元的识别概率;将各语音单元的识别概率的均值,作为所述待评估词语的识别概率,所述识别概率包括准确率和/或虚警率;
和/或,
用于表示所述待评估词语在声学层面的区分性的评估特征包括待评估词语的时长,则所述提取所述待评估词语的评估特征包括:获取所述待评估词语包括的语音单元的时长;将各语音单元的时长之和,作为所述待评估词语的时长;
和/或,
用于表示所述待评估词语在声学层面的区分性的评估特征包括待评估词语的音调特征,则所述提取所述待评估词语的评估特征包括:获取所述待评估词语包括的单字的音调,计算相邻单字之间的音调方差;利用所述相邻单字之间的音调方差进行数学运算,得到所述待评估词语的音调特征;
和/或,
用于表示所述待评估词语在语义层面的区分性的评估特征包括语言模型的得分,则所述提取所述待评估词语的评估特征包括:将所述待评估词语作为输入,经预先构建的语言模型处理后,输出所述待评估词语的得分,所述得分用于表示所述待评估词语出现的频率;
和/或,
用于表示所述待评估词语在语义层面的区分性的评估特征包括待评估词语的词性特征,则所述提取所述待评估词语的评估特征包括:获取所述待评估词语包括的单词的词性;统计不同词性的数目、各不同词性出现的次数,作为所述待评估词语的词性特征;
和/或,
用于表示所述待评估词语在语义层面的区分性的评估特征包括待评估词语的顺滑度特征,则所述提取所述待评估词语的评估特征包括:利用所述待评估词语包括的单词,计算所述待评估词语的正向语义顺滑度和逆向语义顺滑度;利用所述正向语义顺滑度和所述逆向语义顺滑度进行数学运算,得到所述待评估词语的顺滑度特征。
3.根据权利要求1或2所述的方法,其特征在于,确定所述待评估词语不适合作为唤醒词时,所述方法还包括:
提取所述待评估词语的问题特征;
根据所述问题特征,确定所述待评估词语存在的问题类型,所述问题类型用于表示所述待评估词语不适合作为唤醒词的原因。
4.根据权利要求3所述的方法,其特征在于,
所述问题特征包括语言模型的得分,则所述确定所述待评估词语存在的问题类型包括:将所述待评估词语作为输入,经预先构建的语言模型处理后,输出所述待评估词语的得分,所述得分用于表示所述待评估词语出现的频率;当所述待评估词语的得分超过预设分值时,判定所述待评估词语存在的问题类型为高频词汇;
和/或,
所述问题特征包括待评估词语的时长,则所述确定所述待评估词语存在的问题类型包括:获取所述待评估词语包括的语音单元的时长;将各语音单元的时长之和,作为所述待评估词语的时长;当所述待评估词语的时长小于预设时长时,判定所述待评估词语存在的问题类型为时长过短;
和/或,
所述问题特征包括待评估词语的轻音特征,则所述确定所述待评估词语存在的问题类型包括:统计所述待评估词语包括的轻音音素的数目;当所述轻音音素的数目超过预设数目时,判定所述待评估词语存在的问题类型为轻音过多。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810159653.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:中文文本识别方法及装置
- 下一篇:文字信息处理方法、装置及终端