[发明专利]语音交互方法及装置、电子设备、可读存储介质在审

申请号：	201910141976.3	申请日：	2019-02-26
公开（公告）号：	CN109817204A	公开（公告）日：	2019-05-28
发明（设计）人：	李太和;黄有志;顾家荣;万星星	申请（专利权）人：	深圳安泰创新科技股份有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/22;G10L15/26;G10L17/24;H04M1/725
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	518000 广东省深圳市南山区西丽***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本内容语音交互语音指令可读存储介质电子设备触发控制动作用户发音语音解析语音识别准确率终端医疗
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种语音交互方法，所述方法包括以下步骤：对终端界面上的可触发元素进行文本内容设定；其中，所述文本内容包括各类字符；获取包含文本内容的语音指令；对所述语音指令进行语音解析，以得到所述语音指令包含的文本内容；触发所述文本内容对应的元素，并执行对应的控制动作。本发明还提供了一种语音交互装置、电子设备、可读存储介质。本发明解决了现有语音交互技术中交互内容不确定因素多、医疗术语表述复杂且理解难度高、以及在用户发音不标准情况下语音识别准确率不高、识别难度大的技术问题。

技术领域

本发明涉及通讯技术领域，尤其涉及一种语音交互方法及装置、电子设备、可读存储介质。

背景技术

随着语音交互技术的不断发展，语音控制终端的方式已被广泛应用。传统语音交互的语音识别受到用户的口音、语序、语意等多种因素影响，准确率不高；一旦语音识别失败，就无法进行语音交互。此外，传统语音交互的语音识别需要用户说出规定的关键字，系统识别到关键字后才可进行操作，这也需要用户的发音较为标准；但往往普通人的发音难以达到较高的标准度，同时人工智能系统对人类语言的含义解读技术仍然不成熟，尤其是医疗行业等特定行业的术语复杂，解读难度高，还不具备实用性，这样也增加了语音识别的难度，使得语音识别准确度不高。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种语音交互方法及装置、电子设备、可读存储介质，旨在解决现有语音交互技术中交互内容不确定因素多、医疗术语表述复杂且理解难度高、以及在用户发音不标准情况下语音识别准确率不高、识别难度大的技术问题。

为实现上述目的，本发明提供一种语音交互方法，所述方法包括以下步骤：

对终端界面上的可触发元素进行文本内容设定；其中，所述文本内容包括各类字符；

获取包含文本内容的语音指令；

对所述语音指令进行语音解析，以得到所述语音指令包含的文本内容；

触发所述文本内容对应的元素，并执行对应的控制动作。

优选地，所述对终端界面上的可触发元素进行文本内容设定的步骤，具体包括：

在检测到预设文本录入指令时，进入手动录入模式；

在检测对终端的可触发元素的选择指令及对应手动录入的文本内容时，建立可触发元素与文本内容的对应关系；

将已建立的所述对应关系进行保存。