[发明专利]语音响应速度确定方法、相关装置及计算机程序产品有效
申请号: | 202110636622.3 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113380229B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 章福瑜;刘嵘;王坤 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 响应 速度 确定 方法 相关 装置 计算机 程序 产品 | ||
1.一种语音响应速度确定方法,包括:
读取构成测试音频文件的二进制数据流,并将读取到构成所述测试音频文件的全部二进制数据的时刻确定为交互起始时刻;其中,所述测试音频文件存储在本地存储空间;
确定构成所述测试音频文件的全部二进制数据中包含的语音指示信息,并将所述语音指示信息所指示动作的执行时刻确定为交互结束时刻;
计算所述交互结束时刻与所述交互起始时刻的时间差,并利用当前场景的偏差值对所述时间差进行修正,将修正后的时间差确定为语音响应速度。
2.根据权利要求1所述的方法,其中,所述将所述语音指示信息所指示动作的执行时刻确定为交互结束时刻,包括:
确定所述语音指示信息所指示动作的执行对象;其中,所述执行对象包括本地对象和非本地对象;
响应于所述执行对象为所述非本地对象,转发所述语音指示信息至所述非本地对象;
控制所述非本地对象执行所述语音指示信息所指示动作,并控制所述非本地对象返回执行所述所指示动作的时间戳;
将所述时间戳记录的时刻确定为所述交互结束时刻。
3.根据权利要求1所述的方法,还包括:
播报所述语音指示信息和/或所述语音指示信息所指示动作;
响应于接收到针对播报内容的错误反馈,为与所述错误反馈对应的语音指示信息和/或语音指示信息所指示动作附加错误标记;
终止执行附加有所述错误标记的信息或指示的后续动作。
4.根据权利要求1所述的方法,其中,所述确定构成所述测试音频文件的全部二进制数据中包含的语音指示信息,包括:
对构成所述测试音频文件的全部二进制数据中的语音信号进行语义识别,得到实际语义信息;
确定与所述实际语义信息对应的语音指示信息。
5.根据权利要求4所述的方法,其中,所述对构成所述测试音频文件的全部二进制数据中的语音信号进行语义识别,得到实际语义信息,包括:
从构成所述测试音频文件的全部二进制数据中提取所述语音信号;
响应于所述语音信号的实际复杂度超过预设复杂度,将所述语音信号输入调用配置在云端服务器上的经预训练的语义识别模型;其中,所述语义识别模型用于表征语音信号与语义信息之间的对应关系;
接收所述语义识别模型返回的实际语义信息。
6.根据权利要求1所述的方法,其中,响应于存在多个所述测试音频文件,还包括:
根据各所述测试音频文件各自的语音响应速度,计算得到语音响应速度均值;
将所述语音响应速度均值确定为目标语音响应速度。
7.根据权利要求1-6任一项所述的方法,在读取构成测试音频文件的数据流之前,还包括:
获取存储在所述本地存储空间中的包含有所述语音指示信息的测试音频文件。
8.一种语音响应速度确定装置,包括:
数据流读取及起始时刻确定单元,被配置成读取构成测试音频文件的二进制数据流,并将读取到构成所述测试音频文件的全部二进制数据的时刻确定为交互起始时刻;其中,所述测试音频文件存储在本地存储空间;
指示信息确定及结束时刻确定单元,被配置成确定构成所述测试音频文件的全部二进制数据中包含的语音指示信息,并将所述语音指示信息所指示动作的执行时刻确定为交互结束时刻;
语音响应速度确定单元,被配置成计算所述交互结束时刻与所述交互起始时刻的时间差,并利用当前场景的偏差值对所述时间差进行修正,将修正后的时间差确定为语音响应速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110636622.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:香烟气味消除剂及其制备方法
- 下一篇:一种数控机床加工用油污冷却回收装置