[发明专利]语音写作方法、装置、终端和存储介质有效
| 申请号: | 201910111502.4 | 申请日: | 2019-02-12 |
| 公开(公告)号: | CN109817210B | 公开(公告)日: | 2021-08-17 |
| 发明(设计)人: | 赵洪飞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 写作 方法 装置 终端 存储 介质 | ||
本发明实施例公开了一种语音写作方法、装置、终端和存储介质。该方法包括:在用户语音写作过程中,将获取的用户语音信息转换为用户文本信息;将所述用户文本信息与候选行为意图进行匹配,并将匹配到的候选行为意图作为目标行为意图;根据所述目标行为意图,对编辑区的文本内容进行编辑。本发明实施例通过对用户语音行为意图的识别,避免了用户端本身对用户语音复杂的学习过程,且在用户端实现了语音写作指令的匹配,提高了用户端对用户写作指令的响应效率和准确度,满足了用户在写作当中的任何需求,为用户带来了良好的语音写作体验。
技术领域
本发明实施例涉及语音处理技术领域,尤其涉及一种语音写作方法、装置、终端和存储介质。
背景技术
随着语音处理技术的快速发展,越来越多的移动终端或设备采用语音处理技术进行语音的接收、处理和分析等,例如利用语音进行文本的输入等编辑操作。
目前,移动终端本身可以采用强匹配的方式,将语音转换的字符串与逻辑对应的字符串进行比对,在匹配完全相等的情况下而执行相应的逻辑处理;或者移动终端本身可以采用模糊匹配的方式,将语音转换的字符串拆成多个词块,当与逻辑对应的字符串匹配度达到一定比例时即可认为匹配成功,此时再执行相应的逻辑处理。此外,移动终端还可以借助于服务端强大的处理功能,将语音转换的字符串传回服务端,由服务端通过语义分析或深度学习等复杂的处理手段进行指令的匹配,并将匹配结果返回给移动终端进行执行处理。
然而,针对于语音写作场景中,现有移动终端本身的语音处理方式,对于用户输入语音格式要求较高,匹配的准确率较低;且现有借助服务端匹配的方式,对于网络质量要求较高,难以跟随用户的语音写作速度完成大篇幅的写作内容。因此现有语音文本编辑方式无法适应用户的写作过程,适用范围较少,降低用户体验。
发明内容
本发明实施例提供了一种语音写作方法、装置、终端和存储介质,能够提高移动终端用户写作指令的响应效率和准确度。
第一方面,本发明实施例提供了一种语音写作方法,包括:
在用户语音写作过程中,将获取的用户语音信息转换为用户文本信息;
将所述用户文本信息与候选行为意图进行匹配,并将匹配到的候选行为意图作为目标行为意图;
根据所述目标行为意图,对编辑区的文本内容进行编辑。
第二方面,本发明实施例提供了一种语音写作装置,包括:
语音转换模块,用于在用户语音写作过程中,将获取的用户语音信息转换为用户文本信息;
意图识别模块,用于将所述用户文本信息与候选行为意图进行匹配,并将匹配到的候选行为意图作为目标行为意图;
文本编辑模块,用于根据所述目标行为意图,对编辑区的文本内容进行编辑。
第三方面,本发明实施例提供了一种终端,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的语音写作方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的语音写作方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910111502.4/2.html,转载请声明来源钻瓜专利网。





