[发明专利]一种具有语音识别的食堂刷卡装置及使用方法有效
| 申请号: | 201910748064.2 | 申请日: | 2019-08-14 |
| 公开(公告)号: | CN110459216B | 公开(公告)日: | 2021-11-30 |
| 发明(设计)人: | 高兴宇;贺晓莹;宁黎华;廖斌;丁畅;侯晓玲;于方津;李煜;陆佳琪 | 申请(专利权)人: | 桂林电子科技大学 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L15/197;G10L15/14;G07F7/08 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 541004 广西壮族自治区桂*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 具有 语音 识别 食堂 刷卡 装置 使用方法 | ||
1.一种具有语音识别的食堂刷卡装置的使用方法,通过一种具有语音识别的食堂刷卡装置实现,所述装置包括移动设备端、中央处理单元、LED显示刷卡器;
所述中央处理单元包括无线网络系统模块、语音信号接收器、语音识别系统、A/D转换器;
所述移动设备端通过无线网络系统模块与语音信号接收器相连接;
所述无线网络系统模块用于将移动设备端与语音信号接收器进行通信连接;所述语音信号接收器用于接收通过无线网络系统模块发送过来的语音信号,其输出端与语音识别系统相连接;
所述语音识别系统用于对移动设备端输入的语音指令进行降噪处理,并对语音信号进行特征提取,采用高斯混合模型GMM建模,隐马尔科夫模型HMM训练高斯混合模型的方法建立GMM-HMM模型,将提取的每一个特征作为GMM-HMM模型的输入,得出每一个特征的最大似然概率,并根据最大似然概率输出该特征相对应的词语,将每个特征相对应的词语合并正确序列的集合文件;语音识别系统的输出端与A/D转换器的输入端相连接;
所述A/D转换器的输出端与LED显示刷卡器的输入端相连接;
其特征在于:所述使用方法包括如下步骤:
步骤1:将移动设备端与无线网络系统模块连接,确保语音指令可以通过移动设备端传输;移动设备端接收到用户的语音指令,并通过无线网络系统模块将语音指令传输至语音识别系统;
步骤2:语音识别系统通过训练GMM-HMM模型对语音指令进行语音识别,输出与语音指令相对应的文字信号,根据语音信号切分顺序将得到的文字信号合并为正确序列的集合文件,并将该集合文件输出至A/D转换器;
步骤3:A/D转换器将模拟信号转换为数字信号并传输给LED显示刷卡器,由LED显示刷卡器将数字信号显示出来;
所述步骤2的具体步骤如下:
步骤2.1:将移动设备端输出的语音信号进行预处理,所述预处理包括降噪和增强处理,对预处理后的语音信号进行相等帧数波的切分,语音信号切分集合H={h1,h2,…,hg,…,hG},其中hg代表第g个语音信号;
步骤2.2:根据傅立叶变换对hg进行声学特征提取;得到特征序列并形成特征矢量序列
步骤2.3:建立连续型语音指令hg服从高斯混合模型GMM的概率密度函数,并将高斯混合模型整合进隐马尔科夫HMM模型,用以拟合基于状态的输出分布,根据隐马尔科夫模型HMM进行训练,得出语音指令hg的最大似然概率;
概率密度函数p(hg)表示为:
其中,μn代表n个语音变量均值,代表n个语音变量方差,σn代表n个语音变量标准差,cn为权重,混合权重
HMM包含其中,Sg表示隐藏状态的集合,Kg表示输出符号的集合,Ag表示状态转移概率矩阵,Bg表示概率分布矩阵,表示初始状态概率分布,其中,其中,状态转移概率Ag=[aij]N×N,设可观测特征序列为对应的时间长度为T的状态序列集合为Q′={q1,q2,…,qt,…,qT},即表示每一帧语音信号的周期为T,其中qt代表t时刻的状态,qt内包括一个或多个可观测特征;
设定隐藏状态si位于t-1时刻的状态qt-1,隐藏状态sj位于t时刻的状态qt,则隐藏状态从si转移到sj的转移概率为:
aij=P(qt=sj|qt-1=si)
其中,1≤i≤N,1≤j≤N,且P(*)为概率公式;根据上述公式求出状态转移概率Ag;
根据Kg和Sg求出概率分布矩阵Bg;其中在隐藏状态sj位于t时刻的状态为qt的条件下,输出符号vk处于可观测状态的概率表示为:
其中,1≤j≤N,1≤k≤M,且vk代表状态下提取出的符号;根据上述公式得出概率分布矩阵Bg;
求出所有状态的初始状态概率分布其中
其中qi为隐藏状态si下的可观测状态;
采用前向算法计算可观测特征序列的概率分布矩阵t=1时刻的初始状态转移概率初始化:其中代表状态下的概率,计算t+1时刻的aij,公式为:其中1≤t≤T-1,bj(ot+1)代表t+1时刻可观测特征序列的概率;则其中at(i)代表t时刻对应的输出状态转移概率;
对HMM模型参数解码,设特征序列对应的最优状态序列为Q=q′1,q′2,...,q′T,通过维特比算法寻找最优的状态序列;设维特比变量路径函数归纳得出t时刻的路径函数则T时刻对应的最优状态序列为:
其中
HMM的训练通过调节HMM的参数使得最大;采用期望最大化算法对给定语音信号观察序列调节模型参数,使最大,期望分别对参数状态概率分布、状态转移概率以及符号概率分布矩阵记性更新;
更新公式为:
其中γ1(i)代表更新后的状态概率分布;求解出最大似然概率;
步骤2.4:令g=g+1,重复步骤步骤2.2-步骤2.3,得出语音信号切分集合H={h1,h2,…,hg,…,hG}内所有语音信号的最大似然概率;
步骤2.5:根据每个语音信号的最大似然概率得出与其相对应的文字信号,公式如下:
其中,W指文字信号,χ指特征匹配的概率,代表第g个文字信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910748064.2/1.html,转载请声明来源钻瓜专利网。





