[发明专利]利用非自回归模型与整合放电技术的唇语识别方法、系统有效
申请号: | 202011030959.1 | 申请日: | 2020-09-27 |
公开(公告)号: | CN111931736B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 赵洲;童鑫远;肖俊;吴飞 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用非自回归模型与整合放电技术的唇语识别方法、系统,属于唇语识别领域。主要包括如下步骤:1)获取唇语识别训练样本集;2)建立非自回归神经网络模型,包括特征提取网络、编码网络、解码网络和整合放电模块,并在训练过程中引入两个辅助解码器。3)采集要预测语言的唇语视频并处理为连续的唇形图像数据,由训练好的模型生成唇语识别结果。本发明采用整合放电技术模拟源视频帧与输出文本序列之间的对应关系,采用辅助连接时序分类解码器及辅助自回归解码器强化编码器的图像特征表示能力,采用噪声并行解码技术与字节对编码技术减轻唇语识别固有的歧义性问题,实现了良好的并行性,有效提升了唇语识别的性能。 | ||
搜索关键词: | 利用 回归 模型 整合 放电 技术 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011030959.1/,转载请声明来源钻瓜专利网。