[发明专利]文档文件生成装置及文档文件生成方法有效
| 申请号: | 201510033797.X | 申请日: | 2015-01-23 |
| 公开(公告)号: | CN104809099B | 公开(公告)日: | 2018-03-23 |
| 发明(设计)人: | 平塚元规 | 申请(专利权)人: | 京瓷办公信息系统株式会社 |
| 主分类号: | G06F17/21 | 分类号: | G06F17/21 |
| 代理公司: | 北京汇思诚业知识产权代理有限公司11444 | 代理人: | 王刚,龚敏 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 文件 生成 装置 方法 | ||
1.一种文档文件生成装置,其对通过扫描部读取原稿字符而得的字符图像进行字符识别、且生成将所识别的所述字符图像进行了数据化的文档文件,其特征在于,具备:
矢量化单元,其对所述字符图像进行矢量化;
矢量化处理控制单元,其对该矢量化单元的矢量化处理进行控制;
其中,所述矢量化处理控制单元,
在所述矢量化处理开始前的第1阶段,根据所述字符图像的字符数及所述字符图像大小计算出第1文件的大小,
在所述矢量化处理执行中的第2阶段,通过比对由所述字符识别获取的字符坐标与所述矢量化的数据中包含的字符坐标,提取字符图像,并根据该字符图像的字符数及所述字符图像大小计算出第2文件的大小,
在所述矢量化处理完成后的第3阶段,根据所述字符图像的字符数及所述矢量化的数据计算出第3文件的大小,
在所述第1阶段至第3阶段,所述第1至第3文件的大小小于所述原稿文件的大小,则生成写入有通过所述矢量化单元进行矢量化后的数据的矢量化文件。
2.如权利要求1中所述的文档文件生成装置,其特征在于,
所述矢量化处理控制单元具有:
计数单元,其对通过扫描部读取原稿字符而得的字符图像进行字符识别、且对所识别的所述字符图像按照每个字符图像分别进行计数;
文件大小计算比较单元,其计算所述文件大小并进行比较;以及,
图像处理单元,其生成所述矢量化文件或文档文件;
其中,所述文件大小计算比较单元,
在所述第1阶段,通过利用所述计数单元进行计数而得的各个所述字符图像的字符数与各个所述字符图像大小的乘积计算出第1文件大小,
在所述第2阶段,通过比对所述字符识别获取的字符坐标与所述矢量化的数据中包含的字符坐标提取目标字符,并通过所述字符图像的字符数与该被提取的所述目标字符的所述字符图像大小的乘积计算出第2文件大小,
在所述第3阶段,通过所述字符图像的字符数与所述矢量化的数据的乘积计算出第3文件的大小,
并在所述第1阶段、所述第2阶段或所述第3阶段的任一阶段中将所述第1至第3文件的大小与所述原稿文件的大小进行比较;
其中,所述图像处理单元,
在所述第1阶段至第3阶段中,所述第1至第3文件的大小小于所述原稿文件的大小的情况下,将生成所述矢量化文件,
在所述第1阶段、所述第2阶段或所述第3阶段的任一阶段中所述第1至第3文件的大小大于所述原稿文件的大小的情况下,将中断之后的处理,遵循所述原稿文件的文件格式生成文档文件。
3.如权利要求2中所述的文档文件生成装置,其特征在于,所述文件大小计算比较单元通过所述计数单元得出的各个所述字符图像的合计字符数与平均了各个所述字符图像大小的平均字符图像大小的乘积,计算所述第1文件的大小。
4.如权利要求2中所述的文档文件生成装置,其特征在于,所述图像处理单元,
通过比对所述字符识别获取的字符坐标与所述矢量化后数据中包含的字符坐标,将一致的字符图像的矢量化数据注册至字体词典中,并利用注册后的矢量化数据生成所述矢量化文件。
5.如权利要求2中所述的文档文件生成装置,其特征在于,所述图像处理单元将与通过所述字符识别获取的字符图像的图型中得出的特征量相一致的字符图像的矢量化数据注册至字体词典中,并利用该注册后的矢量化数据生成所述矢量化文件。
6.如权利要求4中所述的文档文件生成装置,其特征在于,在所述字体词典中进行注册时,对于已注册完的字符不进行注册。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京瓷办公信息系统株式会社,未经京瓷办公信息系统株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510033797.X/1.html,转载请声明来源钻瓜专利网。





