[发明专利]测试语料生成方法、装置及电子设备有效
| 申请号: | 202010273970.4 | 申请日: | 2020-04-09 |
| 公开(公告)号: | CN111488463B | 公开(公告)日: | 2023-08-29 |
| 发明(设计)人: | 宋雨 | 申请(专利权)人: | 中国银行股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
| 地址: | 100818 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 测试 语料 生成 方法 装置 电子设备 | ||
1.一种测试语料生成方法,其特征在于,包括:
获取线上的历史测试语料;
基于实体库对所述历史测试语料进行实体识别确定所述历史测试语料包含的至少两个实体维度;
于知识图谱网络库中确定所述至少两个实体维度组成的多个短语;
分别将所述多个短语替换所述历史测试语料中所述至少两个实体维度对应的短语,获得多条测试语料;
在所述获取线上的历史测试语料之前还包括:
建立各个产品的多维度知识图谱;其中不同产品的多维度知识图谱中的多个维度相同;所述多维度知识图谱包括产品名称、产品操作和业务属性三个维度;
各个产品的多维度知识图谱组成知识图谱网络库;
从各个产品的多维度知识图谱抽取相同维度的实体组成一实体集,重复执行该步骤直到获得多个维度对应的多个实体集;其中,包括抽取产品名称实体组建产品名称实体集,抽取产品操作组建产品操作实体集和抽取业务属性组建业务属性实体集;
所述多个维度的实体集组成所述实体库;
在所述至少两个实体维度包括产品名称和产品操作的情况下,所述于知识图谱网络库中确定所述至少两个实体维度组成的多个短语包括:
针对所述知识图谱网络库中各个产品实体执行下述操作:
于所述知识图谱网络库中产品实体的知识图谱;
于所述产品实体的知识图谱中确定与该产品实体对应的多个产品操作;
将所述产品实体与所述多个产品操作分别组成多个短语。
2.如权利要求1所述的方法,其特征在于,所述基于实体库对所述历史测试语料进行实体识别确定所述历史测试语料包含的至少两个实体维度包括:
将所述历史测试语料分别于所述实体库中多个维度的实体集进行实体识别;
若于一个实体集中识别成功则确定所述历史测试语料包含该实体维度;
若于一个实体集中识别不成功则确定所述历史测试语料不包含该实体维度;
将于所述实体库中多个维度的实体集中识别成功的实体维度,确定为所述历史测试语料包含的至少两个实体维度。
3.如权利要求1所述的方法,其特征在于,在获得多条测试语料之后还包括:
添加所述多条测试语料至测试语料库,以供对问答机器人进行测试。
4.一种测试语料生成装置,其特征在于,包括:
获取单元,用于获取线上的历史测试语料;
识别单元,用于基于实体库对所述历史测试语料进行实体识别确定所述历史测试语料包含的至少两个实体维度;
组成单元,用于于知识图谱网络库中确定所述至少两个实体维度组成的多个短语;
替换单元,用于分别将所述多个短语替换所述历史测试语料中所述至少两个实体维度对应的短语,获得多条测试语料;
还包括:
建立单元,用于在所述获取线上的历史测试语料之前,建立各个产品的多维度知识图谱;其中不同产品的多维度知识图谱中的多个维度相同;所述多维度知识图谱包括产品名称、产品操作和业务属性三个维度;各个产品的多维度知识图谱组成知识图谱网络库;
从各个产品的多维度知识图谱抽取相同维度的实体组成一实体集,重复执行该步骤直到获得多个维度对应的多个实体集;其中,包括抽取产品名称实体组建产品名称实体集,抽取产品操作组建产品操作实体集和抽取业务属性组建业务属性实体集;所述多个维度的实体集组成所述实体库;
在所述至少两个实体维度包括产品名称和产品操作的情况下,组成单元于知识图谱网络库中确定所述至少两个实体维度组成的多个短语包括:
针对所述知识图谱网络库中各个产品实体执行下述操作:于所述知识图谱网络库中产品实体的知识图谱;于所述产品实体的知识图谱中确定与该产品实体对应的多个产品操作;将所述产品实体与所述多个产品操作分别组成多个短语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273970.4/1.html,转载请声明来源钻瓜专利网。





