[发明专利]一种基于多元语义特征和掩码策略的文本纠错方法和系统在审
申请号: | 202111457771.X | 申请日: | 2021-12-02 |
公开(公告)号: | CN114912418A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 郭磊;边延风;褚国庆;邵亚红;余明;杨荣繁 | 申请(专利权)人: | 天翼数字生活科技有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/232;G06F40/242;G06F40/30;G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦;亓云 |
地址: | 200072 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种基于掩码策略和多元语义特征编码的文本纠错方法和系统,方法包括:将待纠错的语音转写文本作为输入,利用预先构建的混淆词典来确定该语音转写文本中的备选错误位置;利用经训练的基于多元语义特征提取的自编码器中的编码器来对该语音转写文本进行编码以得到连续的特征向量;将所得到的特征向量输入经训练的基于掩码策略的错误检测模型以得到针对所确定的备选错误位置中的每个备选错误位置的错误发生置信度;以及对于每个备选错误位置,响应于该备选错误位置的错误发生置信度高于预定义的阈值,利用该混淆词典来对该备选错误位置的文本进行纠错,以输出经纠错的语音转写文本。 | ||
搜索关键词: | 一种 基于 多元 语义 特征 掩码 策略 文本 纠错 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼数字生活科技有限公司,未经天翼数字生活科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111457771.X/,转载请声明来源钻瓜专利网。