[发明专利]无需标准读音的音素级的低功耗口语评价及缺陷诊断方法在审
| 申请号: | 201410229186.8 | 申请日: | 2014-05-28 |
| 公开(公告)号: | CN103985391A | 公开(公告)日: | 2014-08-13 |
| 发明(设计)人: | 柳超 | 申请(专利权)人: | 柳超 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/48 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100010 北京市东城区朝阳*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 无需 标准 读音 音素 功耗 口语 评价 缺陷 诊断 方法 | ||
1.一种无需标准读音的音素级的低功耗口语评价方法,其特征在于,包括如下步骤:
(1)对用户语音进行声学特征提取,得到每一帧对应的特征向量,进而得到与用户语音所对应的特征向量序列;
(2)对于给定的文本,它对应一个音素序列,记做
pall={sil,p1,sil,p2,sil,p3,sil,...,p(M-1),sil,pM,sil},其中sil代表停顿音,基于加权有限状态转换器Q使用Viterbi算法对用户语音所对应的特征向量序列进行解码操作,得到特征向量序列到上述音素序列pall的对齐α,
此对齐α的计数向量记做
β={ns0,n1,ns1,n2,ns2,n3,ns3,...,n(M-1),ns(M-1),nM,nsM},
其中ni表示对应于第i个非停顿音音素的帧的数量,nsi表示对应于第i+1个停顿音的帧的数量,M是此样本文本对应的非停顿音音素的数量,上述基于加权有限状态转换器Q与Viterbi算法的解码过程在给出对齐的同时,也给出了每个特征向量所对应的HMM状态;
其中Q=πε(min(det(Hοdet(Cοdet(LοG))))),其中的min表示有关加权有限状态转换器的最小化操作,det表示有关加权有限状态转换器的确定化操作,符号ο表示有关加权有限状态转换器的复合操作,πε表示去除加权有限状态转换器中ε符号的操作;
声学模型H、发音词典模型L以及上下文相关的音素模型C均为加权有限状态转换器,并且均是基于加权有限状态转换器的大词汇量连续语音识别技术的训练过程得到;对于给定的文本,产生此文本对应的语言模型G,从而产生与该文本对应的加权有限状态转换器Q;
(3)对每个音素,通过计算其对应的特征向量或特征向量组与其在声学模型H中的数学表示之间吻合度,可以评价用户在每个音素上的发音质量,吻合度越高,说明发音质量越好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柳超,未经柳超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410229186.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:点钞机环境净化器
- 下一篇:数码产品保护外壳防跌落结构





