[发明专利]文档生成器的获取方法、文档生成方法、装置及电子设备有效
| 申请号: | 201910770061.9 | 申请日: | 2019-08-20 |
| 公开(公告)号: | CN110516202B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 刘钰安 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06F40/103 | 分类号: | G06F40/103;G06V30/40;G06V30/18;G06N3/0475;G06N3/045;G06N3/084 |
| 代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 吕静 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 生成器 获取 方法 生成 装置 电子设备 | ||
本申请公开了一种文档生成器的获取方法、文档生成方法、装置及电子设备,涉及图像处理技术领域。所述方法通过拍摄的文档图像以及电子文档的图像并结合边缘损失对循环一致性生成对抗网络进行训练,从而获得可根据拍摄的文档图像生成电子文档图像的文档生成器。通过该文档生成器可以生成字迹清晰的电子文档图像。
技术领域
本申请涉及图像处理技术领域,更具体地,涉及一种文档生成器的获取方法、文档生成方法、装置及电子设备。
背景技术
书籍、手稿、打印稿件等纸质文档是文字的载体、文化的载体,但是纸质文档不易保存,也不易传播。为了对纸质文档进行有效保存以及进行有效传播,可以将纸质文档数字化,即将纸质文档转换为可存储于存储器、可通过网络进行传播的电子数据。通常的,将纸质文档数字化的方式通常为对纸质文档进行影印拍照。但是通过影印拍照的方式获得的数字化文档清晰度差,从而导致阅读体验差。
发明内容
鉴于上述问题,本申请提出了一种文档生成器的获取方法、文档生成方法、装置及电子设备,用于获取可将纸质文档的文档图像处理为清晰的电子文档图像的文档生成器,以改善上述问题。
第一方面,本申请实施例提供了一种文档生成器的获取方法,所述文档生成器用于根据拍摄的文档图像生成电子文档图像,所述方法包括:从第一图像集选取一个图像作为源域图像,从第二图像集选取一个图像作为目标域图像,所述第一图像集包括拍摄的多个文档图像,所述第二图像集包括多个电子文档的图像,定义第一图像集中的图像所在的图像域为源域,定义第二图像集中的图像所在的图像域为目标域;将所述源域图像以及所述目标域图像输入循环一致性生成对抗网络,生成由所述源域图像映射到所述目标域的映射图像以及由所述映射图像映射到源域的重建图像,并获取所述映射图像与所述目标域图像之间的判别损失以及所述源域图像与所述重建图像之间的重建损失;获取所述源域图像的边缘图像与所述映射图像之间的边缘损失;根据所述判别损失、重建损失以及边缘损失的和对所述循环一致性生成对抗网络中的生成器以及判别器进行优化;根据优化后的循环一致性生成对抗网络获得文档生成器。
第二方面,本申请实施例提供了一种文档生成方法,用于根据上述方法获取的文档生成器生成电子文档图像,所述方法包括:获取拍摄纸质文档获得的文档图像;将所述文档图像输入所述文档生成器;以所述文档生成器生成的图像作为所述文档图像对应的电子文档图像。
第三方面,本申请实施例提供了一种文档生成器的获取装置,所述文档生成器用于根据拍摄的文档图像生成电子文档图像,所述装置包括:图像选取模块,用于从第一图像集选取一个图像作为源域图像,从第二图像集选取一个图像作为目标域图像,所述第一图像集包括拍摄的多个文档图像,所述第二图像集包括多个电子文档的图像,定义第一图像集中的图像所在的图像域为源域,定义第二图像集中的图像所在的图像域为目标域;第一损失获取模块,用于将所述源域图像以及所述目标域图像输入循环一致性生成对抗网络,生成由所述源域图像映射到所述目标域的映射图像以及由所述映射图像映射到源域的重建图像,并获取所述映射图像与所述目标域图像之间的判别损失以及所述源域图像与所述重建图像之间的重建损失;第二损失获取模块,用于获取所述源域图像的边缘图像与所述映射图像之间的边缘损失;优化模块,用于根据所述判别损失、重建损失以及边缘损失的和对所述循环一致性生成对抗网络中的生成器以及判别器进行优化;确定模块,用于根据优化后的循环一致性生成对抗网络获得文档生成器。
第四方面,本申请实施例提供了一种文档生成装置,用于根据上述方法获取的文档生成器生成电子文档图像,或者用于根据上述装置获取的文档生成器生成电子文档图像,所述方法包括:原始图像获取模块,用于获取拍摄纸质文档获得的文档图像;输入模块,用于将所述文档图像输入所述文档生成器;生成模块,用于以所述文档生成器生成的图像作为所述文档图像对应的电子文档图像。
第五方面,本申请实施例提供了一种电子设备,包括存储器以及处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时,所述处理器执行上述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910770061.9/2.html,转载请声明来源钻瓜专利网。





