[发明专利]语音交互方法及装置、电子设备、可读存储介质在审
| 申请号: | 201910141976.3 | 申请日: | 2019-02-26 |
| 公开(公告)号: | CN109817204A | 公开(公告)日: | 2019-05-28 |
| 发明(设计)人: | 李太和;黄有志;顾家荣;万星星 | 申请(专利权)人: | 深圳安泰创新科技股份有限公司 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/22;G10L15/26;G10L17/24;H04M1/725 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
| 地址: | 518000 广东省深圳市南山区西丽*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本内容 语音交互 语音指令 可读存储介质 电子设备 触发 控制动作 用户发音 语音解析 语音识别 准确率 终端 医疗 | ||
本发明提供一种语音交互方法,所述方法包括以下步骤:对终端界面上的可触发元素进行文本内容设定;其中,所述文本内容包括各类字符;获取包含文本内容的语音指令;对所述语音指令进行语音解析,以得到所述语音指令包含的文本内容;触发所述文本内容对应的元素,并执行对应的控制动作。本发明还提供了一种语音交互装置、电子设备、可读存储介质。本发明解决了现有语音交互技术中交互内容不确定因素多、医疗术语表述复杂且理解难度高、以及在用户发音不标准情况下语音识别准确率不高、识别难度大的技术问题。
技术领域
本发明涉及通讯技术领域,尤其涉及一种语音交互方法及装置、电子设备、可读存储介质。
背景技术
随着语音交互技术的不断发展,语音控制终端的方式已被广泛应用。传统语音交互的语音识别受到用户的口音、语序、语意等多种因素影响,准确率不高;一旦语音识别失败,就无法进行语音交互。此外,传统语音交互的语音识别需要用户说出规定的关键字,系统识别到关键字后才可进行操作,这也需要用户的发音较为标准;但往往普通人的发音难以达到较高的标准度,同时人工智能系统对人类语言的含义解读技术仍然不成熟,尤其是医疗行业等特定行业的术语复杂,解读难度高,还不具备实用性,这样也增加了语音识别的难度,使得语音识别准确度不高。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种语音交互方法及装置、电子设备、可读存储介质,旨在解决现有语音交互技术中交互内容不确定因素多、医疗术语表述复杂且理解难度高、以及在用户发音不标准情况下语音识别准确率不高、识别难度大的技术问题。
为实现上述目的,本发明提供一种语音交互方法,所述方法包括以下步骤:
对终端界面上的可触发元素进行文本内容设定;其中,所述文本内容包括各类字符;
获取包含文本内容的语音指令;
对所述语音指令进行语音解析,以得到所述语音指令包含的文本内容;
触发所述文本内容对应的元素,并执行对应的控制动作。
优选地,所述对终端界面上的可触发元素进行文本内容设定的步骤,具体包括:
在检测到预设文本录入指令时,进入手动录入模式;
在检测对终端的可触发元素的选择指令及对应手动录入的文本内容时,建立可触发元素与文本内容的对应关系;
将已建立的所述对应关系进行保存。
优选地,所述对终端界面上的可触发元素进行文本内容设定的步骤,具体包括:
根据预设文本设定规则,对终端界面上的可触发元素进行文本内容设定。
优选地,所述可触发元素包括上层元素和/或与上层元素对应的下层元素;
所述触发所述文本内容对应的元素,并执行对应的控制动作的步骤,具体包括:
根据所述文本内容,判断是否触发上层元素对应的下层元素;
若是,则在检测到包含下层文本内容的第一语音指令时,对所述第一语音指令进行语音解析,以得到所述第一语音指令包含的下层文本内容;
根据下层文本内容,执行对应下层元素的控制动作。
优选地,所述对所述语音指令进行语音解析,以得到所述语音指令包含的文本内容的步骤之后,还包括:
判断所述语音指令包含的文本内容是否符合预设冲突条件;
若符合,则生成并显示预设冲突提示消息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳安泰创新科技股份有限公司,未经深圳安泰创新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910141976.3/2.html,转载请声明来源钻瓜专利网。





