[发明专利]测试数据特征提取方法、测试方法及相关装置在审
| 申请号: | 202110292100.6 | 申请日: | 2021-03-18 |
| 公开(公告)号: | CN113032253A | 公开(公告)日: | 2021-06-25 |
| 发明(设计)人: | 陈振坤;张伟杰 | 申请(专利权)人: | 广州虎牙科技有限公司 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
| 地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 测试数据 特征 提取 方法 测试 相关 装置 | ||
1.一种测试数据特征提取方法,其特征在于,所述测试数据特征提取方法包括:
获取测试用例中的原始语料短句;
提取所述原始语料短句的关键词,形成关键词集;
采用预训练的词嵌入模型对所述关键词集进行调整,得到所述原始语料短句对应的向量化特征语句;
采用预设加密算法对所述向量化特征语句进行加密,得到所述原始语料短句对应的测试数据特征。
2.根据权利要求1所述的测试数据特征提取方法,其特征在于,所述提取所述原始语料短句的关键词,形成关键词集,包括:
将所述原始语料短句进行分词处理,得到原始单词集;
采用预设处理规则对所述原始单词集进行过滤,得到所述关键词集。
3.根据权利要求2所述的测试数据特征提取方法,其特征在于,所述预设处理规则包括去停用词规则、去标点规则、去数字规则中的至少一种。
4.根据权利要求1所述的测试数据特征提取方法,其特征在于,所述采用预训练的词嵌入模型对所述关键词集进行调整,得到所述原始语料短句对应的向量化特征语句,包括:
将所述关键词集输入所述预训练的词嵌入模型,得到词向量;
使用嵌入空间中与本体词最近的相邻词将所述本体词替换,得到所述原始语料短句对应的向量化特征语句。
5.根据权利要求1所述的测试数据特征提取方法,其特征在于,
所述测试用例为结构化测试用例;和/或,所述预设加密算法为消息摘要算法。
6.一种测试方法,其特征在于,所述测试方法包括:
利用测试数据特征提取方法对测试用例中的所有原始语料短句进行测试数据特征的提取,得到每个原始语料短句对应的测试数据特征;
根据每个原始语料短句对应的测试数据特征建立索引值,以将所述测试用例中的所有原始语料短句按照不同的测试数据特征进行分类;
将所述测试用例中的所有原始语料短句按照分类结果进行测试;
其中,所述测试数据特征提取方法为权利要求1至5任一项所述的测试数据特征提取方法。
7.一种测试数据特征的提取装置,其特征在于,包括:
语料获取模块,所述语料获取模块用于获取测试用例中的原始语料短句;
关键词提取模块,所述关键词提取模块用于提取所述原始语料短句的关键词,形成关键词集;
向量化模块,所述向量化模块用于采用预训练的词嵌入模型对所述关键词集进行调整,得到所述原始语料短句对应的向量化特征语句;
加密模块,所述加密模块用于采用预设加密算法对所述向量化特征语句进行加密,得到所述原始语料短句对应的测试数据特征。
8.一种测试装置,其特征在于,包括:
特征提取模块,所述特征提取模块用于利用测试数据特征提取方法对测试用例中的所有原始语料短句进行测试数据特征的提取,得到每个原始语料短句对应的测试数据特征;
分类模块,所述分类模块用于根据每个原始语料短句对应的测试数据特征建立索引值,以将所述测试用例中的所有原始语料短句按照不同的测试数据特征进行分类;
测试模块,所述测试模块用于将所述测试用例中的所有原始语料短句按照分类结果进行测试;
其中,所述测试数据特征提取方法为权利要求1至5任一项所述的测试数据特征提取方法。
9.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至5任一项所述的测试数据特征提取方法,或权利要求6所述的测试方法。
10.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至5任一项所述的测试数据特征提取方法,或权利要求6所述的测试方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110292100.6/1.html,转载请声明来源钻瓜专利网。





