[发明专利]一种语音识别路径规划方法、系统及平台在审
| 申请号: | 202011627783.8 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112815957A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 汪剑;雷欣;李志飞 | 申请(专利权)人: | 出门问问(武汉)信息科技有限公司 |
| 主分类号: | G01C21/36 | 分类号: | G01C21/36 |
| 代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 刘婧 |
| 地址: | 430223 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 识别 路径 规划 方法 系统 平台 | ||
1.一种语音识别路径规划方法,其特征在于,包括:
获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;
基于预测候选集,识别所述音频序列特征,并得到对应的序列信息表示;
调用预先训练得到的语音识别模型,根据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;
调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。
2.根据权利要求1所述的语音识别路径规划方法,其特征在于,该方法还包括:
所述解析路径信息采用可视化方式输出,包括语音输出和/或文字输出;
所述深度强化网络智能体输出语音的所述解析路径信息时,调用预先训练得到的语言生成模型,将所述语音输出的解析路径信息,识别为文字并输出。
3.根据权利要求1所述的语音识别路径规划方法,其特征在于,该方法还包括:
应用随机梯度下降方法,根据预设的间隔时间或实时,迭代更新所述深度强化网络智能体的参数信息。
4.根据权利要求1至3任一项所述的语音识别路径规划方法,其特征在于,所述语音识别模型和所述深度强化网络智能体的训练过程包括:
创建所述语音识别模型和所述深度强化网络智能体,并配置模型参数;
利用Actor-Critic方法,训练所述语音识别模型和所述深度强化网络智能体,并更新模型参数;
其中,所述深度强化网络智能体进一步包括:Actor网络智能体和Critic网络智能体;所述Actor网络智能体、所述Critic网络智能体在序列长度维度进行循环,完成序列路径决策,得到语音输出的解析路径。
5.根据权利要求4所述的语音识别路径规划方法,其特征在于,所述更新模型参数,进一步包括:
所述Actor网络智能体根据当前状态s,从可行的动作集中采样任意一个动作a;所述Critic网络智能体根据所述Actor网络智能体执行所述动作a和所述当前状态s,对所述动作a进行评估,若选取的动作a与标注路径中的动作不一致,则给予惩罚值,否则给予奖励值;调用预设的状态动作转移模型,所述Actor网络智能体与所述Critic网络智能体在序列长度维度进行循环,获取新的状态s′,并根据所述新的状态s′采样新的动作a′;
所述Actor网络智能体的策略参数θ更新为θ+aθQw(s,a)Δθln(πθ(a|s)),其中,πθ(a|s)为所述当前状态s下每个动作的采样概率,Qw(s,a)为所述Critic网络智能体对动作和状态对s,a的评估值,Δθln(πθ(a|s))表示ln(πθ(a|s))对参数θ进行求导;
所述Critic网络智能体的参数w更新为w+awδtΔw Qw(s,a),其中,δt=rt+λQw(s′,a′)-Qw(s,a),Qw(s′,a′)为所述Critic网络智能体对新采样动作和状态对s′,a′的评估值。
6.一种语音识别路径规划系统,其特征在于,包括:
数据获取模块,用于获取语音信息;
特征提取模型,用于提取音频序列特征,并基于预测候选集,识别所述音频序列特征,得到对应的序列信息表示;
语音识别模型,用于据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;
深度强化网络智能体,用于完成序列路径决策,得到语音输出的解析路径信息;
预测候选集,配置有文字数据库,包括文字及其位置索引和概率信息;
实体数据库,配置有标注处理的路径信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问(武汉)信息科技有限公司,未经出门问问(武汉)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011627783.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种窗式净化系统
- 下一篇:一种基于区块链的业务协同数据共享及隐私保护方法





