[发明专利]语音输入方法、电子设备以及计算机存储介质在审
申请号: | 202111658540.5 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114327355A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 金泽群 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G06F16/632;G06F16/9532;G10L15/26 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 输入 方法 电子设备 以及 计算机 存储 介质 | ||
1.一种语音输入方法,其特征在于,包括:
接收语音识别引擎对用户输入语音进行语音识别而产生的识别文本;
将用户个性化词库中的个性化词条与所述识别文本进行发音匹配,以获得与所述识别文本的发音相匹配的个性化候选词条;以及
将所述个性化候选词条呈现给用户。
2.根据权利要求1所述的语音输入方法,其特征在于,所述将用户个性化词库中的个性化词条与所述识别文本进行发音匹配,包括:
将所述识别文本从文本序列转换成发音序列;
将所述个性化词条与所述发音序列进行发音相似度匹配;以及
在所述个性化词条与所述发音序列的全部或某一部分的发音相似度大于或等于预设的第一阈值时,将所述个性化词条作为所述个性化候选词条。
3.根据权利要求1所述的语音输入方法,其特征在于,所述将所述个性化候选词条呈现给用户之前,进一步包括:
获取所述个性化候选词条的词条得分,其中,所述词条得分通过所述个性化候选词条的词频、时间戳和/或所述个性化候选词条与所述识别文本的匹配部分之间的发音相似度计算获得;
基于所述词条得分对所述个性化候选词条进行排序。
4.根据权利要求3所述的语音输入方法,其特征在于,所述基于所述词条得分对所述个性化候选词条进行排序之前,包括:
获取所述个性化候选词条的语言逻辑得分,其中,所述语言逻辑得分是将所述个性化候选词条替换至所述识别文本后,利用预定的语言模型对替换后的所述识别文本的语言逻辑合理性进行分析获得的;
所述基于所述词条得分对所述个性化候选词条进行排序,包括:
基于所述词条得分和所述语言逻辑得分获得综合得分;
基于所述综合得分对所述个性化候选词条进行排序。
5.根据权利要求1所述的语音输入方法,其特征在于,所述将所述个性化候选词条呈现给用户,包括:
利用所述个性化候选词条直接替换所述识别文本的匹配部分;或者
在所述识别文本之外独立呈现所述个性化候选词条。
6.根据权利要求1所述的语音输入方法,其特征在于,所述方法进一步包括:
获取所述用户对所述识别文本的修改结果;
从所述修改结果中提取所述个性化词条;
将所述个性化词条更新到所述用户个性化词库。
7.根据权利要求6所述的语音输入方法,其特征在于,所述从所述修改结果中提取所述个性化词条之前,包括:
判断所述用户对所述识别文本的修改是否为改变所述输入语音的交互意图;
若为改变所述输入语音的交互意图,则不执行所述从所述修改结果中提取所述个性化词条。
8.根据权利要求7所述的语音输入方法,其特征在于,所述判断所述用户对所述识别文本的修改是否为改变所述输入语音的交互意图,包括:
在所述识别文本和所述修改结果存在以下情况中的至少一种时,判定为改变所述输入语音的交互意图:
所述识别文本和所述修改结果的长度差异大于或等于预设的第二阈值;
所述识别文本和所述修改结果的发音相似度差异大于或等于预设的第三阈值;
所述识别文本和/或所述修改结果中存在无法从发音字典中查询正确发音的部分。
9.根据权利要求6所述的语音输入方法,其特征在于,所述从所述修改结果中提取所述个性化词条,包括:
将所述识别文本和所述修改结果进行分词,以分别形成多个第一词条和多个第二词条;
对所述多个第一词条和多个第二词条进行编辑距离对齐,以形成多个词条对;
判断每个所述词条对中的第一词条和第二词条是否相同;
若不同,则将对应的第二词条作为所述个性化词条。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111658540.5/1.html,转载请声明来源钻瓜专利网。