[发明专利]测试语料生成方法、装置、设备及可读写存储介质有效
申请号: | 201810437036.4 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108597503B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 杨博昌;黄燕;施展 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18;G10L15/197 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王雨;王宝筠 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测试 语料 生成 方法 装置 设备 读写 存储 介质 | ||
1.一种测试语料生成方法,其特征在于,包括:
获取人机交互场景下的历史用户交互语料;
对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式;
根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率;
参考每一种组成方式的出现概率,逐条生成测试语料,以得到足够数量的测试语料。
2.根据权利要求1所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,包括:
对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料所属的业务;
所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,包括:
根据各条历史用户交互语料所属的业务,确定每一种业务的出现概率。
3.根据权利要求2所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,还包括:
对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料对应的操作;
所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,还包括:
根据各条历史用户交互语料所属的业务及对应的操作,确定每一种操作在同一业务下的出现概率。
4.根据权利要求3所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,还包括:
对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料包含的语义槽及语义槽取值;
所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,还包括:
根据各条历史用户交互语料所属的业务及包含的语义槽,确定每一种语义槽在同一业务下的出现概率。
5.根据权利要求4所述的方法,其特征在于,还包括:
对每一种语义槽的语义槽取值进行词扩展,得到扩展后的语义槽取值。
6.根据权利要求4所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,还包括:
对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料包含的指定类型的词;
所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,还包括:
根据各条历史用户交互语料所属的业务及包含的指定类型的词,确定每一种指定类型的词在同一业务下的出现概率。
7.根据权利要求6所述的方法,其特征在于,所述参考每一种组成方式的出现概率,逐条生成测试语料,包括:
参考每一业务的出现概率,确定当前待生成的一通测试语料中,每一条测试语料所属的目标业务;
在预置的用户意图库中,随机选取所述目标业务下的一条用户意图,所述用户意图记录了对应历史用户交互语料所属的目标业务、对应的目标操作及包含的目标语义槽;
参考所述目标操作在所述目标业务下的出现概率,及所述目标语义槽在所述目标业务下的出现概率,确定待生成的每一条测试语料对所述目标操作及所述目标语义槽的第一包含情况;
至少根据所述第一包含情况,逐条生成测试语料,直至已生成的各条测试语料包含了所述目标操作及所述目标语义槽为止;
将生成的各条测试语料组成一通测试语料。
8.根据权利要求7所述的方法,其特征在于,所述参考每一种组成方式的出现概率,逐条生成测试语料,还包括:
参考每一种指定类型的词在所述目标业务下的出现概率,确定待生成的每一条测试语料对所述每一种指定类型的词的第二包含情况;
所述至少根据所述第一包含情况,逐条生成测试语料,直至已生成的各条测试语料包含了所述目标操作及所述目标语义槽为止,包括:
根据所述第一包含情况和所述第二包含情况,逐条生成测试语料,直至已生成的各条测试语料包含了所述目标操作及所述目标语义槽为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810437036.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于对抗训练的领域语音识别训练方法
- 下一篇:一种语音解析方法、装置及机器人