[发明专利]语音模型训练方法、系统及计算机可读存储介质有效
| 申请号: | 202010074272.1 | 申请日: | 2020-01-22 |
| 公开(公告)号: | CN111326145B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 塞力克·斯兰穆;陈乙银;郑斌 | 申请(专利权)人: | 深圳市灰鲨科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26 |
| 代理公司: | 上海雍灏知识产权代理事务所(普通合伙) 31368 | 代理人: | 沈汶波 |
| 地址: | 518055 广东省深圳市南山区桃源街道福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 模型 训练 方法 系统 计算机 可读 存储 介质 | ||
本发明提供了一种语音模型训练方法、系统及计算机可读存储介质,语音模型训练方法,包括以下步骤:形成一提示界面,显示激活语音消息接收功能的信息;接收外部形成的至少一条语音消息;识别每一语音消息形成至少一条识别结果消息,并将识别结果消息显示于一映射界面;于映射界面上还显示目标应用程序的操作单元;将每一识别结果消息与一个或多个操作单元关联,形成配置关系后保存。采用上述技术方案后,通过语音模型的训练,可减少语音语义识别使得工作时间,降低语音操作过程中的功耗。
技术领域
本发明涉及训练模型生成领域,尤其涉及一种语音模型训练方法、系统及计算机可读存储介质。
背景技术
随着智能终端、平板电脑、笔记本电脑的快速普及,人们对上述设备的使用已越来越有依赖性。对于此类设备的使用,用户一般基于设备所具有的触摸屏来输入指定,例如单击、双击、长按触摸屏上显示的操作按钮,以向设备输出操作指令。
为丰富用户向设备的指令输入,不少设备厂商开发出了语音操作的功能。通过对用户向设备发出的语音的识别,将其解析为对设备的操作后,执行相应的操作。
现有技术中,通过语音识别将语音输入转换为语音指令,再将语音指令和游戏中的游戏指令进行映射的方式来实现,具体实现时,需要将语音采集识别模块和语音控制指令集打包成SDK并深度集成到游戏模块中,或需要终端设备中进行输入驱动程序的修改实现成本高,需要游戏厂家和设备厂家的深度合作开发才能完成。且该方式兼容性差,需要针对每一个游戏指令进行适配,以及未考虑到语音识别的功耗问题。此外,若语音识别的流程较长或卡顿,将影响用户的指令输入。
因此,需要一种新型的语音模型训练方法,可以训练得到应用于低功耗场景操控的模型,提高智能终端的续航能力。
发明内容
为了克服上述技术缺陷,本发明的目的在于提供一种语音模型训练方法、系统及计算机可读存储介质,通过语音模型的训练,可减少语音语义识别时的工作时间,降低语音操作过程中的功耗。
本发明公开了一种语音模型训练方法,包括以下步骤:
形成一提示界面,显示激活语音消息接收功能的信息;
接收外部形成的至少一条语音消息;
识别每一语音消息形成至少一条识别结果消息,并将识别结果消息显示于一映射界面;
于映射界面上还显示目标应用程序的操作单元;
将每一识别结果消息与一个或多个操作单元关联,形成配置关系后保存。
优选地,识别每一语音消息形成至少一条识别结果消息,并将识别结果消息显示于一映射界面的步骤包括:
解析语音消息并将语音消息转换为文字消息;
提取文字消息中的关键词;
保存关键词为至少一条识别结果消息,并发送识别结果消息至一服务器端以于服务器端生成语音模型。
优选地,提取文字消息中的关键词的步骤包括:
获取目标应用程序及目标应用程序的常用语;
将文字消息与常用语对比,提取文字消息中与常用语匹配或相似度高于一预设阈值的内容;
保存内容为关键词或修改内容至相似度最接近的常用语为关键词。
优选地,于映射界面上还显示目标应用程序的操作单元的步骤包括:
获取目标应用程序的类型及关键帧;
提取关键帧中对目标应用程序操作的部分或全部操作单元。
优选地,将每一识别结果消息与一个或多个操作单元关联,形成配置关系后保存的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市灰鲨科技有限公司,未经深圳市灰鲨科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010074272.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属纳米团簇结构优化方法
- 下一篇:一种物品推荐方法、装置及终端设备





