[发明专利]语音识别方法和装置在审

申请号：	201910594044.4	申请日：	2019-07-03
公开（公告）号：	CN110297775A	公开（公告）日：	2019-10-01
发明（设计）人：	陈壮壮;李雁南;张彦;王大鹏	申请（专利权）人：	中国工商银行股份有限公司
主分类号：	G06F11/36	分类号：	G06F11/36;G06F17/27;G10L15/26
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	孙乳笋;王涛
地址：	100140 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本方法和装置相似度分析音频信号应用软件语音交互语音识别语料库拼接音频信号转换语音识别结果语音识别算法结束时间点电话银行精准定位流程控制虚拟声卡语音内容成功率语音测试电脑
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种语音识别方法和装置，该方法包括：获取电脑虚拟声卡的音频信号；将音频信号进行切分；通过语音识别算法将切分后的音频信号转换为文本，并进行文本拼接；将拼接后的文本与电话银行语料库中的文本进行相似度分析；根据相似度分析，确定语音识别结果。本发明能够精准定位语音开始/结束时间点，在语音交互类应用软件语料库完整的情况下，流程控制成功率很高，且能准确识别语音内容，减少语音交互类应用软件的测试时间。

技术领域

本发明涉及语音交互领域，尤其涉及一种语音识别方法和装置。

背景技术

在语音交互类应用软件的测试工作中，涉及大量的语音场景，不同的语音场景有不同的语音专线、语音菜单，目前测试方法主要分为人力测试和半自动化测试。人力测试主要缺陷为测试时间长，每个语音场景都需要经过按键选择、输入指令、听取语音内容等过程，因此人力测试只适用于简单的语音场景测试工作。对于大型复杂的语音场景，目前多采用半自动化测试，使用自动化脚本进行按键、输入指令等操作，但半自动化测试主要有以下缺陷：

1.无法精确定位语音开始/结束时间点，不能在有效时间内进行按键和输入指令操作，经常导致输入错误、输入超时、语音挂断等问题。

2.语音内容代表的含义不明确，对于返回的语音结果需要人为复查。

所以目前的半自动化测试需要测试人员进行人为干预，没有真正实现自动化。

发明内容

为了解决现有技术的不能精确定位语音开始/结束时间点，无法有效控制语音测试流程、不能准确识别语音内容的缺陷，本发明提供了一种语音识别方法和装置。

第一方面，本发明提供一种语音识别方法，所述语音识别方法包括：

获取电脑虚拟声卡的音频信号；

将所述音频信号进行切分；

通过语音识别算法将切分后的音频信号转换为文本，并进行文本拼接；

将拼接后的文本与电话银行语料库中的文本进行相似度分析；

根据所述相似度分析，确定语音识别结果。

进一步地，所述获取电脑虚拟声卡的音频信号包括：