[发明专利]一种测试数据填充方法、装置、计算机设备及存储介质在审
申请号: | 202111162415.5 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113886249A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 赵俊杰 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/00;G06F16/2455;G06F21/60;G06F21/62 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 200135 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 测试数据 填充 方法 装置 计算机 设备 存储 介质 | ||
1.一种测试数据填充方法,其特征在于,包括:
获取高频文字数据集,利用所述高频文字数据集训练OCR模型;
利用所述OCR模型对待测试软件的页面进行文字识别,并基于文字识别结果对待测试软件的页面进行区域划分,并对划分出的每一目标填充区域匹配相应的逻辑算法;
对待测试软件的页面环境进行环境识别,并通过环境识别结果匹配相应的数据库;
根据所述逻辑算法从所述数据库中提取与每一目标填充区域对应的待填充数据,并利用加解密算法对待填充数据进行解密处理,将解密得到的解密数据自动填充于对应的所述目标填充区域。
2.根据权利要求1所述的测试数据填充方法,其特征在于,所述获取高频文字数据集,利用所述高频文字数据集训练OCR模型,包括:
获取包含高频文字的文字图片,并将所述文字图片转化tif格式;
基于预先生成的box文件,对tif格式的文字图片进行文字识别,并标注为目标文字图片;
将所述目标文字图片输入至OCR模型中,利用OCR模型生成所述目标文字图片对应的文字区域特征;
对所述文字区域特征进行优化,以识别页面输入框信息。
3.根据权利要求2所述的测试数据填充方法,其特征在于,所述将所述目标文字图片输入至OCR模型中,利用OCR模型生成所述目标文字图片对应的文字区域特征,包括:
将所述目标文字图片预处理为灰度图像;
将所述灰度图像输入至开源Tesseract-OCR模型中,并由所述开源Tesseract-OCR模型输出页面识别的字段值。
4.根据权利要求1所述的测试数据填充方法,其特征在于,所述利用所述OCR模型对待测试软件的页面进行文字识别,并基于文字识别结果对待测试软件的页面进行区域划分,并对划分出的每一目标填充区域匹配相应的逻辑算法,包括:
通过所述OCR模型提取待测试软件的页面中的元素特征;
对所述元素特征生成多个候选区域,以及每一候选区域的目标得分;
结合每一候选区域的目标得分以及每一候选区域在待测试软件的页面的位置,对所有候选区域筛选得到至少一个目标区域,并将至少一个目标区域作为目标填充区域;
根据目标填充区域的类型为每一划分区域匹配对应的逻辑算法。
5.根据权利要求1所述的测试数据填充方法,其特征在于,所述目标填充区域为验证码填充区域,所述测试数据填充方法还包括:
对所述验证码填充区域进行图像分割处理,确定所述验证码填充区域的输入框以及验证码区域;
利用所述OCR模型对所述验证码区域中的验证码进行识别;
自动将鼠标焦点移动至所述输入框,并将识别到的验证码填充至所述输入框。
6.根据权利要求1所述的测试数据填充方法,其特征在于,所述对待测试软件的页面环境进行环境识别,并通过环境识别结果匹配相应的数据库,包括:
通过页面元素识别或者服务接口监听,对待测试软件的页面环境进行环境识别;
根据环境识别结果确定所述待测试软件的页面环境的环境ip;
基于所述环境ip,为待测试软件的页面环境匹配相同ip的数据库。
7.根据权利要求1所述的测试数据填充方法,其特征在于,所述利用加解密算法对待填充数据进行解密处理,将解密得到的解密数据自动填充于对应的所述目标填充区域,包括:
对所述待填充数据进行脱敏处理;
将脱敏处理后的敏感数据转换为明文字段;
利用加解密算法对所述明文字段进行解密处理,并将解密得到的解密数据填充至所述目标填充区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111162415.5/1.html,转载请声明来源钻瓜专利网。