[发明专利]语音识别模型建立、语音识别方法、装置、设备和介质在审
申请号: | 202011140575.5 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112116907A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 陈顺飞 | 申请(专利权)人: | 浙江同花顺智能科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音识别模型建立、语音识别方法、装置、设备和存储介质,包括:确定拼音建模单元和汉字词组建模单元;利用拼音建模单元确定音频训练集的拼音标签,利用汉字建模单元确定音频训练集的汉字词组标签;通过预先构建的多任务训练模型,利用拼音标签、汉字词组标签和音频训练集中音频特征进行训练,建立语音识别模型。本实施例中,通过汉字作为基础建模单元,避免出现过多的oov,然后在中文汉字的基础上加入高频词汇进行建模,使得模型在训练过程中对于常用词汇能够进行整体性的学习,同时,在汉字词组建模单元的基础上,引入拼音建模单元,以解决训练数据稀疏问题,使得模型能够更好的区分不同发音的汉字识别,提升模型鲁棒性。 | ||
搜索关键词: | 语音 识别 模型 建立 方法 装置 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江同花顺智能科技有限公司,未经浙江同花顺智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011140575.5/,转载请声明来源钻瓜专利网。