[发明专利]手写样本数字化方法、装置、计算机设备及存储介质在审
| 申请号: | 201811085666.6 | 申请日: | 2018-09-18 |
| 公开(公告)号: | CN109492657A | 公开(公告)日: | 2019-03-19 |
| 发明(设计)人: | 金晨;刘克亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/51;G06F21/62 |
| 代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 手写样本 二进制序列 元素信息 预设 矩阵 计算机设备 存储介质 图片像素 样本数据 样本图片 样本 数字化 二进制 数据文件保存 序列化处理 样本数据库 标注信息 计算效率 模型训练 数据集中 数据文件 文本识别 资源消耗 组合方式 计算量 像素点 像素 写入 统一 | ||
1.一种手写样本数字化方法,其特征在于,所述手写样本数字化方法包括:
获取手写样本数据集中的手写样本,其中,所述手写样本包括样本图片和所述样本图片的标注信息;
根据所述样本图片中每个像素点的像素值,生成所述样本图片对应的图片像素矩阵;
按照预设的组合方式,对所述图片像素矩阵和所述标注信息进行组合,得到所述手写样本对应的元素信息;
对所述元素信息进行序列化处理,得到所述元素信息对应的二进制序列;
将所述二进制序列写入预设的样本数据文件中;
将所述样本数据文件保存到预设的样本数据库中。
2.如权利要求1所述的手写样本数字化方法,其特征在于,所述标注信息包括至少一个标注属性,所述对所述元素信息进行序列化处理,得到所述元素信息对应的二进制序列包括:
按照预设的顺序提取所述图片像素矩阵中的所述像素值,得到像素值序列;
按照所述标注信息中预设的标注格式,对所述标注信息进行解析,得到所述标注信息中的每个所述标注属性;
分别对每个所述标注属性进行序列化,得到每个所述标注属性的属性序列化结果;
按照预设的连接方式,将所述像素值序列和每个所述标注属性的属性序列化结果连接成所述元素信息的序列化结果,并将所述元素信息的序列化结果转换成二进制序列。
3.如权利要求2所述的手写样本数字化方法,其特征在于,所述标注属性包括所述样本图片的图片名称、所述样本图片的图片尺寸、所述样本图片中的文本内容和所述文本内容在所述样本图片中的相对位置信息,所述标注属性的属性序列化结果包括所述图片名称的属性序列化结果、所述图片尺寸的属性序列化结果、所述文本内容的属性序列化结果和所述相对位置信息的属性序列化结果,所述分别对每个所述标注属性进行序列化,得到每个所述标注属性的属性序列化结果包括:
从预设的随机数池中选取一个未被使用的随机数作为所述图片名称的属性序列化结果,并将所述图片名称和所述未被使用的随机数对应保存到预设的映射表中;
按照所述图片尺寸预设的尺寸格式,对所述图片尺寸进行解析以得到尺寸数据,并将得到的尺寸数据作为所述图片尺寸的属性序列化结果;
根据预设的字符编码字典,获取所述文本内容中每个字符对应的编码,将所述编码作为所述文本内容的属性序列化结果;
按照所述相对位置信息中预设的位置表示方式,对所述相对位置信息进行解析,并将得到的位置数据作为所述相对位置信息的属性序列化结果。
4.如权利要求1至3任一项所述的手写样本数字化方法,其特征在于,所述对所述元素信息进行序列化处理,得到所述元素信息对应的二进制序列还包括:
计算所述元素信息对应的字符串的哈希值;
对所述哈希值和预设的序列化服务器的数量之间进行取模运算,并将得到的运算结果作为目标序列号;
按照序列号与所述序列化服务器之间预设的对应关系,确定所述目标序列号对应的目标序列化服务器;
将所述元素信息发送到所述目标序列化服务器进行序列化处理;
接收所述目标序列化服务器返回的所述元素信息对应的二进制序列。
5.如权利要求3所述的手写样本数字化方法,其特征在于,所述将所述样本数据文件保存到预设的样本数据库中包括:
按照预设的加密方式,对所述样本数据文件进行加密处理,得到加密样本文件;
将所述加密样本文件保存到预设的样本数据库中。
6.如权利要求5所述的手写样本数字化方法,其特征在于,所述将所述加密样本文件保存到预设的样本数据库中之后,所述手写样本数字化方法还包括:
若接收到用户对所述手写样本的获取请求,则根据所述获取请求中包含的用户身份信息,确定所述用户的获取权限;
若所述获取权限为允许获取,则从所述样本数据库中获取所述加密样本文件,并按照预设的解密方式,对所述加密样本文件进行解密,得到解密文件;
从所述解密文件中读取所述元素信息对应的二进制序列;
对所述二进制序列进行反序列化处理,得到所述样本图片的图片像素矩阵和所述样本图片的标注信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811085666.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于输出信息的方法和装置
- 下一篇:一种点云分类方法及终端





