[发明专利]一种测试数据填充方法、装置、计算机设备及存储介质在审
申请号: | 202111162415.5 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113886249A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 赵俊杰 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/00;G06F16/2455;G06F21/60;G06F21/62 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 200135 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 测试数据 填充 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种测试数据填充方法、装置、计算机设备及存储介质,涉及计算机技术领域,该方法包括:获取高频文字数据集,利用高频文字数据集训练OCR模型;利用OCR模型对待测试软件的页面进行文字识别,并对待测试软件的页面进行区域划分,并对划分出的每一目标填充区域匹配相应的逻辑算法;对待测试软件的页面环境进行环境识别,并通过环境识别结果匹配相应的数据库;根据逻辑算法从数据库中提取与每一目标填充区域对应的待填充数据,并利用加解密算法对待填充数据进行解密处理,将解密得到的解密数据自动填充于对应的目标填充区域。本发明通过可以解决软件测试过程中的数据查询问题,还可以提高测试数据的填充精度和填充效率。
技术领域
本发明涉及计算机技术领域,特别涉及一种测试数据填充方法、装置、计算机设备及存储介质。
背景技术
软件质量的保障离不开测试工作,手工测试占比最比,不论是日常的功能测试还是上线前的回归测试,甚至开发的功能自测,都依赖测试数据。在规范的日常测试开发过程中,即使测试数据也是脱敏的加密数据,以及丰富的环境,数据库都给测试过程数据使用带来不便。
对于UI自动化测试,数据的mapping(绘制)关系是前期维护好的,因此大部分数据的关联都是依赖前期维护的数据;
对于API自动化测试,维护好整个数据的匹配关系存在较大的困难,即使代码足够健壮,所有数据关联在复杂的代码逻辑下得以维护,但其本质更偏向自动化测试而非探索性的测试。
因此,要支持所有场景的覆盖,用例开发成本、维护成本都比较高。并且无论是UI自动化测试还是API自动化测试,均并不是为了解决数据查询及复杂关联的查询问题,无法解决手工测试、探索性测试过程中耗时较多的查数过程。
发明内容
本发明实施例提供了一种测试数据填充方法、装置、计算机设备及存储介质,旨在解决软件测试过程中的数据查询问题,以及提高测试数据的填充精度和填充效率。
第一方面,本发明实施例提供了一种测试数据填充方法,包括:
获取高频文字数据集,利用所述高频文字数据集训练OCR模型;
利用所述OCR模型对待测试软件的页面进行文字识别,并基于文字识别结果对待测试软件的页面进行区域划分,并对划分出的每一目标填充区域匹配相应的逻辑算法;
对待测试软件的页面环境进行环境识别,并通过环境识别结果匹配相应的数据库;
根据所述逻辑算法从所述数据库中提取与每一目标填充区域对应的待填充数据,并利用加解密算法对待填充数据进行解密处理,将解密得到的解密数据自动填充于对应的所述目标填充区域。
进一步的,所述获取高频文字数据集,利用所述高频文字数据集训练OCR模型,包括:
获取包含高频文字的文字图片,并将所述文字图片转化tif格式;
基于预先生成的box文件,对tif格式的文字图片进行文字识别,并标注为目标文字图片;
将所述目标文字图片输入至OCR模型中,利用OCR模型生成所述目标文字图片对应的文字区域特征;
对所述文字区域特征进行优化,以识别页面输入框信息。
进一步的,所述将所述目标文字图片输入至OCR模型中,利用OCR模型生成所述目标文字图片对应的文字区域特征,包括:
将所述目标文字图片预处理为灰度图像;
将所述灰度图像输入至开源Tesseract-OCR模型中,并由所述开源Tesseract-OCR模型输出页面识别的字段值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111162415.5/2.html,转载请声明来源钻瓜专利网。