[发明专利]基于人工智能的静默语音识别方法、装置及存储介质在审
| 申请号: | 202111135824.6 | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113870858A | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 罗剑;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L15/25 | 分类号: | G10L15/25;G10L15/16;G10L15/06;G10L15/26 |
| 代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 王迎;袁文婷 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 静默 语音 识别 方法 装置 存储 介质 | ||
1.一种基于人工智能的静默语音识别方法,其特征在于,所述方法包括:
获取与终端设备发射的静默信号相对应的嘴部运动的反馈信号;
对所述反馈信号进行预处理,获取与所述反馈信号对应的相位信号;
基于所述相位信号获取与所述嘴部运动对应的相位特征信号;
基于所述相位特征信号对预设神经网格模型进行训练,直至所述神经网络模型收敛在预设范围内,形成文字识别模型;
基于所述文字识别模型对嘴部运动发出的静默语音信号进行识别。
2.如权利要求1所述的基于人工智能的静默语音识别方法,其特征在于,所述获取与终端设备发射的静默信号相对应的嘴部运动的反馈信号的步骤包括:
预设启动信号作为所述静默信号的启动条件;
基于所述启动条件通过所述终端设备向待检测的嘴部发射所述静默信号;
获取经嘴部运动反射回来的与所述静默信号相对应的反馈信号。
3.如权利要求1或2所述的基于人工智能的静默语音识别方法,其特征在于,所述对所述反馈信号进行预处理,获取与所述反馈信号对应的相位信号的步骤包括:
对所述反馈信号进行低通滤波处理,获取与所述反馈信号相对应且相互正交的同向分量I和正交分量Q;
基于所述同向分量I和所述正交分量Q,获取与所述反馈信号对应的复合信号;
基于所述复合信号确定与所述反馈信号对应的相位信号。
4.如权利要求3所述的基于人工智能的静默语音识别方法,其特征在于,
所述反馈信号的表达公式如下:
所述同向分量I的表达公式如下:
所述正交分量Q的表达公式如下:
其中,所述复合信号的表达公式如下:
其中,c表示声音的传播速度,θp表示所述反馈信号的相位偏移量,Ap表示所述反馈信号的振幅,表示所述反馈信号的相位,p表示传播,dp(t)表示传播路径,f表示频率,t表示时间。
5.如权利要求1或2所述的基于人工智能的静默语音识别方法,其特征在于,所述基于所述相位信号获取与所述嘴部运动对应的相位特征信号的步骤包括:
分别获取不同频率的发射波的相位信号;其中,所述静默信号包括同时发射的不同频率的多个发射波;
基于预设采样时间获取同一频率下相位信号的一阶相位差和二阶相位差;
基于所有频率的相位信号的一阶相位差和二阶相位差,获取所述相位特征信号。
6.如权利要求5所述的基于人工智能的静默语音识别方法,其特征在于,
所述静默信号的表达公式如下:
A∑kcos[2π(f+kδf)t]
t时刻的一阶相位差的表达公式如下:
t时刻的二阶相位差的表达公式如下:
其中,A表示振幅,k表示第k个发射波,f表示频率,δf表示相邻发射波之间的频率差,t表示时间,表示所述相位信号的相位。
7.如权利要求1所述的基于人工智能的静默语音识别方法,其特征在于,
所述文字识别模型的形成步骤包括:
对所述相位特征信号进行切割处理,获取相互重叠的切片数据;
将所述切片数据输入所述神经网络模型的编码部分,获取与所述切片数据相对应的编码输出;
将所述编码输出输入所述神经网络模型的解码部分,获取与所述相位特征信号对应的预测文本标签;
基于所述预测文本标签的条件概率,确定与所述嘴部的运动相对应的识别结果;
基于所述识别结果的损失函数,训练完成所述文字识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111135824.6/1.html,转载请声明来源钻瓜专利网。





