[发明专利]对识别结果进行辅助修改的方法和装置有效
| 申请号: | 202011516219.9 | 申请日: | 2020-12-21 |
| 公开(公告)号: | CN112580619B | 公开(公告)日: | 2022-06-28 |
| 发明(设计)人: | 李哲;李若愚;王伟 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/26;G06V30/148;G06V10/774;G06V10/82;G06K9/62;G06F40/126;G06F40/232;G06N3/04 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 结果 进行 辅助 修改 方法 装置 | ||
本说明书实施例提供了对识别结果进行辅助修改的方法和装置。根据实施例的方法,首先将通过终端设备识别得到的参考识别结果对应输出到预先根据语义特征划分好的语义分割单元中,通过将从语义分割单元中输出的与参考识别结果相关的目标文本输入到预先训练的修改结果预测模型中,该修改结果预测模型通过至少两组样本集训练得到,每一组样本集中包括一个样本目标文本与一个样本识别结果,此后,用户可以根据从修改结果预测模型中输出的辅助修改结果完成对识别结果的修改。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及对识别结果进行辅助修改的方法和装置。
背景技术
目前,利用终端设备对待识别的目标进行自动识别的技术得到了广泛的应用,为人们的生活提供了便利。
比如,光学字符识别(Optical Character Recognition,OCR)技术能够将纸张上的字符识别为计算机文字,其已被广泛应用于证件识别、车牌识别和文档识别等领域。
在对待识别的目标进行自动识别,得到识别结果后,该识别结果中往往会存在错误。因此,需要提供一种对识别结果进行辅助修改的方案。
发明内容
本说明书一个或多个实施例描述了对识别结果进行辅助修改的方法和装置,能够提供辅助修改结果,从而通过该辅助修改结果加快用户对终端的识别结果的修改过程。
根据第一方面,提供了对识别结果进行辅助修改的方法,包括:
在语义分割单元中输出终端设备对待识别文本的参考识别结果;
获取所述语义分割单元中当前输出的与所述参考识别结果相关的目标文本;
将该目标文本输入预先训练的修改结果预测模型;其中,所述修改结果预测模型通过至少两组样本集训练得到,每一组样本集中包括一个样本目标文本与一个样本识别结果;
获得该修改结果预测模型输出的所述参考识别结果对应的辅助修改结果。
在一个实施例中,所述修改结果预测模型包括:纠错模型;所述样本集包括:第一样本集;
所述第一样本集中的样本目标文本为:对样本待识别文本识别后得到的样本参考识别结果;
所述第一样本集中的样本识别结果为:根据该样本参考识别结果最终确定的识别结果;
与所述参考识别结果相关的目标文本包括:所述参考识别结果对应的文本;
所述参考识别结果对应的辅助修改结果包括:所述纠错模型输出的第一辅助修改结果。
在一个实施例中,所述修改结果预测模型进一步包括:用户修改预测模型;所述样本集进一步包括:第二样本集;
所述第二样本集中的样本目标文本为:用户输入的样本修改信息;
所述第二样本集中的样本识别结果为:根据该样本修改信息最终确定的识别结果;
在获得所述纠错模型输出的第一辅助修改结果之后,进一步包括:
接收用户在所述语义分割单元中当前输入的修改信息;
将当前输入的修改信息输入所述用户修改预测模型;
由所述用户修改预测模型输出第二辅助修改结果。
在一个实施例中,所述第二辅助修改结果不包括所述第一辅助修改结果。
在一个实施例中,所述修改结果预测模型包括:用户修改预测模型;所述样本集包括:第二样本集;
所述第二样本集中的样本目标文本为:用户输入的样本修改信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011516219.9/2.html,转载请声明来源钻瓜专利网。





