[发明专利]一种语音信息的处理方法、装置、设备和存储介质在审
申请号: | 201810864520.5 | 申请日: | 2018-08-01 |
公开(公告)号: | CN109036406A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 干晓萍;范思越 | 申请(专利权)人: | 深圳创维-RGB电子有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信息 文字信息 编辑操作 编辑指令 存储介质 目标文字 语音库 语音控制电器 语音信息转换 语音输入法 电器设备 接收用户 口音识别 用户体验 语音功能 受限 匹配 存储 参考 | ||
1.一种语音信息的处理方法,其特征在于,包括:
在语音功能开启后,接收用户输入的当前语音信息;
如果所述当前语音信息与语音库中已存储的参考语音信息不匹配,则将所述当前语音信息转换为文字信息进行显示;
获取对所述文字信息的编辑指令,并根据所述编辑指令对所述文字信息执行编辑操作,并将执行编辑操作后的新的文字信息作为目标文字信息;
将所述目标文字信息与所述当前语音信息对应存入所述语音库中。
2.根据权利要求1所述的方法,其特征在于,还包括:
如果所述当前语音信息与语音库中已存储的参考语音信息相匹配,则显示所述当前语音信息所对应的文字信息;
如果接收到用户的确认指令,则控制当前设备执行与所述文字信息对应的控制操作。
3.根据权利要求1所述的方法,其特征在于,还包括:
在语音功能开启后,如果在设定时间内未接收到用户输入的当前语音信息,则将当前语音输入界面切换为文字输入界面,以供用户进行文字输入。
4.根据权利要求2所述的方法,其特征在于,所述当前语音信息与语音库中已存储的参考语音信息相匹配包括:
基于预设语音识别算法对所述语音信息进行预处理,得到多个语音片段;
基于预设声学模型,将所述多个语音片段与语音库中已存储的参考语音信息进行相似度比较;
如果所述相似度达到设定阈值,则确定所述当前语音信息与语音库中已存储的参考语音信息相匹配。
5.根据权利要求2所述的方法,其特征在于,所述确认指令为:
用户通过遥控器发出的确认指令;或,
包含有确认标识的语音信息。
6.根据权利要求3所述的方法,其特征在于,还包括:
在用户进行文字输入时,识别用户输入的首字符;
如果所述首字符与本地已存储的多个目标词汇的首字符相匹配,则将多个目标词汇按照使用频率递减的方式进行展示;其中,所述多个目标词汇均为使用频率达到预设频率的词汇。
7.一种语音信息的处理装置,其特征在于,包括:
当前语音信息获取模块,用于在语音功能开启后,接收用户输入的当前语音信息;
第一显示模块,用于如果所述当前语音信息与语音库中已存储的参考语音信息不匹配,则将所述当前语音信息转换为文字信息进行显示;
文字信息编辑模块,用于获取对所述文字信息的编辑指令,并根据所述编辑指令对所述文字信息执行编辑操作,并将执行编辑操作后的新的文字信息作为目标文字信息;
存储模块,用于将所述目标文字信息与所述当前语音信息对应存入所述语音库中。
8.根据权利要求7所述的装置,其特征在于,还包括:
第二显示模块,用于如果所述当前语音信息与语音库中已存储的参考语音信息相匹配,则显示所述当前语音信息所对应的文字信息;
控制模块,用于如果接收到用户的确认指令,则控制当前设备执行与所述文字信息对应的控制操作。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的语音信息的处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的语音信息的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳创维-RGB电子有限公司,未经深圳创维-RGB电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810864520.5/1.html,转载请声明来源钻瓜专利网。