[发明专利]一种基于知识图谱的众测助理实现方法有效
申请号: | 202110642819.8 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113297089B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王崇骏;何强强;姚懿容;江娟;谢俊元 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/36;G06F40/289;G06F40/295;G06F40/30 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 孙建朋 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 助理 实现 方法 | ||
本发明公开了一种基于知识图谱的众测助理实现方法。数据采集阶段,确定好与测试领域相关的关键词;数据预处理阶段,设计相应的规则提取内容中的三元组,同时将别名、外文名用于实体对齐,与通用知识图谱CN‑DBpedia合并;数据存储阶段,以图数据库Neo4j存储数据,利用Cypher查询语句将三元组嵌入图数据库中;问句解析阶段,从用户的输入中,利用模板匹配从中抽取出槽值对,槽对应实体,值对应关系或属性,用py2neo嵌入Cypher语句查询相应的结果,并以聊天格式返回给用户。本发明以图数据库作为存储结构,满足了智能助理所要求的最大延时,领域内的知识图谱能够使智能助理为测试人员提供更好的帮助。
技术领域
本发明属于众包测试领域,尤其涉及一种基于知识图谱的众测助理实现方法。
背景技术
随着互联网技术的发展,使得雇佣不同平台,不同位置的测试人员成为可能。众包测试作为测试领域的新兴趋势,充分利用了众包和云平台的优势。它可以扩展测试池,避免了内部测试人员的偏见性,且产品公司只为报告的有效漏洞付费,降低了测试的成本。
在传统的测试领域,要求测试人员具有较为专业的能力素质,包括测试技术,领域知识,甚至是相关经验等。众测平台降低了测试准入门槛,却带来了更大的不确定性,由于众测成员能力参差不齐,这给众测任务的高质量完成带来了挑战。如何平衡测试人员的测试技能,发现更多有效的漏洞,提高软件的质量,面临着巨大的挑战。
当前的解决方法集中于为测试人员进行评分,绘制测试人员的能力记录,信用记录。根据用户历史完成情况判断其测试技术;同时,对每一个测试任务划分其测试难度,选择特定的调度算法,将合适的任务分配给合适的测试对象。然而这不能解决非专业测试人员经常提交无效、重复的漏洞。通过构建融合领域特征的自动化测试和众测人员测试模型,实现人机协同-反馈机制,形成兼具机器高效性和人工领域特性的人工协同测试技术,深层次泛化和延伸众包测试的内涵,从而为获得高质量测试结果提供全面支持。
发明内容
本发明目的在于提供一种基于知识图谱的众测助理实现方法,以解决众测领域测试人员能力参差不齐,测试结果质量低的技术问题。
为解决上述技术问题,本发明的具体技术方案如下:
一种基于知识图谱的众测助理实现方法,其特征在于,包括以下步骤:
步骤1、数据采集,获取与测试相关的关键词;
步骤2、数据预处理,利用正则表达式提取网页句式,并利用规则抽取其中的三元组,同时将别名,外文名用于实体对齐,与通用知识图谱DBpedia合并,得到测试领域知识图谱;
步骤3、数据存储,利用Cypher查询语句,将数据存储在图数据库Neo4j中;
步骤4、问句解析,解析用户问句中的槽值对,并查询图数据库,将结果按照固定句式返回给用户。
进一步的,步骤1中获取关键词,包括以下步骤:
步骤1.1、从书籍中查找测试的概念和方法;
步骤1.2、在开放答题网页,回答与测试相关的题目,补全关键词;
步骤1.3、爬取关键词,利用人工的方式对解析得到的三元组的实体判断是否属于测试领域,若是则添加到关键词库。
进一步的,步骤2具体包括以下步骤:
步骤2.1、获取三元组的规则包括:从结构化的信息栏提取三元组、从符合要求的特定句式提取三元组、人工补充三元组;
步骤2.2、实体对齐:将信息栏中的别名,英文名来对关键词进行对齐,在查询别名和英文名时自动对齐到本名;
步骤2.3、图谱合并,将测试领域的知识图谱与通用领域DBpedia知识图谱进行合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110642819.8/2.html,转载请声明来源钻瓜专利网。