[发明专利]一种导入人工智能超深度学习用于语音图像识别的方法有效
申请号: | 201811249231.0 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109087646B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 韩青江 | 申请(专利权)人: | 武汉拓睿传奇科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L21/0208;H04L29/08;G06K9/62 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 430000 湖北省武汉市东*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 导入 人工智能 深度 学习 用于 语音 图像 识别 方法 | ||
1.一种导入人工智能超深度学习用于语音图像识别的方法,导入人工智能超深度学习用于语音图像识别模块,包括触摸屏、图像识别模块、语音识别模块和CORTEX-A75处理器,其特征在于:所述触摸屏具有摄像头、麦克风、程序储存器、随机储存器数据、图像识别模块、语音识别模块和CORTEX-A75处理器,所述图像识别模块包括摄像控制模块和图像对比模块,所述摄像控制模块包括图像处理模块和图片传输模块,所述语音识别模块包括预处理系统、特征提取系统和模式匹配系统,且模式匹配系统内具有语言模型库,所述预处理系统电连接特征提取系统,且特征提取系统与模式匹配系统数据连接,实现语音数据识别,所述图像识别模块电连接摄像头,所述语音识别模块电连接麦克风,所述图像识别模块和语音识别模块分别与CORTEX-A75处理器数据连接,且CORTEX-A75处理器与程序储存器和随机储存器数据连接,实现图像数据和语音数据的处理和存储,所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接;
具体识别方法如下:
图像识别步骤:通过触摸屏内的图像识别模块将摄像头拍摄的图片通过图像处理模块进行处理,且处理后传输至图像对比模块,通过CORTEX-A75处理器数据连接对其进行信息处理和传输,且CORTEX-A75处理器通过程序储存器内的数据进行检索对比并产生第一对比指令或第二对比指令,所述第一对比指令为程序储存器中至少有一项信息与处理后传输至图像对比模块对比后的结果对应,且根据第一对比指令的结果进入结果相应的图片应用系统中至少有一项信息与处理后传输至图像对比模块的图片数据参数进行对比得到识别结果的位置,且继续对其进行操作,操作后选择退出该系统;所述第二对比指令为程序储存器中不具有任意一项信息与处理后传输至图像对比模块对比后的结果对应,根据第二对比指令的结果进入创建新图片信息对话框,且产生确认创建指令和取消指令,所述确认创建指令将通过CORTEX-A75处理器在储存器中创建处理后传输至图像对比模块对比后的结果对应的位置信息;所述取消指令为取消操作,且退出该系统;
语音识别步骤:通过触摸屏内的语音识别模块将麦克风输入的语音信号通过预处理系统进行矫正处理实现语音信号数字化,再由特征提取系统进行特征分析,抽取可反映语音本质的特征参数,形成矢量序列,且通过模式匹配系统由CORTEX-A75处理器对语言模型库内的声学模版参数进行对比得到识别结果,且CORTEX-A75处理器通过程序储存器内的数据进行检索对比并产生第一对比指令或第二对比指令,所述第一对比指令的为程序储存器中至少有一项信息与语言模型库内的声学模版参数进行对比得到识别结果对应,且根据第一对比指令的结果进入结果相应的应用系统中至少有一项信息处理与语言模型库内的声学模版参数进行对比得到识别结果的位置,且继续对其进行操作,操作后选择退出该系统;所述第二对比指令为程序储存器中不具有任意一项信息与语音本质的特征参数的结果对应,根据第二对比指令的结果进入创建新语音信息对话框,且产生确认创建指令和取消指令,所述确认创建指令将通过CORTEX-A75处理器在储存器中创建语音本质的特征参数的结果对应的语音信息;所述取消指令为取消操作,且退出该系统。
2.根据权利要求1所述的一种导入人工智能超深度学习用于语音图像识别的方法,其特征在于:所述麦克风具有多组,所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接,可定期实现更新程序储存器、随机储存器的资源数据和语言模型库,进而扩大人员图像语音检索的范围,且利用CORTEX-A75处理器将处理后的图片语音通过网络控制器上传于云端服务器,实现数据共享。
3.根据权利要求1所述的一种导入人工智能超深度学习用于语音图像识别的方法,其特征在于:所述预处理系统内具有反混叠失真滤波器、预加重器、端点检测模块和噪声滤波器。
4.根据权利要求1所述的一种导入人工智能超深度学习用于语音图像识别的方法,其特征在于:所述特征提取系统具有LPC、LPCC、MFCC和ASCC。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉拓睿传奇科技有限公司,未经武汉拓睿传奇科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811249231.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医疗软管路径监测及控制系统
- 下一篇:一种汽车显示屏生产用屏幕检测装置