[发明专利]问答数据生成方法及装置、存储介质有效

专利信息
申请号: 201910387830.7 申请日: 2019-05-10
公开(公告)号: CN110134775B 公开(公告)日: 2021-08-24
发明(设计)人: 刘金财;高翔;于向丽 申请(专利权)人: 中国联合网络通信集团有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06N5/02
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 张子青;刘芳
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 问答 数据 生成 方法 装置 存储 介质
【说明书】:

发明提供一种问答数据生成方法及装置、存储介质。该方法包括:对初始数据进行关键词预处理,得到关键词组与问答模板,然后,利用已训练好的第一机器学习模型与第二机器学习模型分别对所述关键词组与问答模板组进行处理,得到第一结果集与第二结果集;所述第一结果集用于指示与各关键词组对应的候选问答模板,所述第二结果集用于指示与各问答模板对应的候选关键词组,从而,对所述第一结果集与所述第二结果集进行匹配互选,得到互选结果,进而,根据所述互选结果,生成问答数据。本发明的方法降低了主观因素对问答数据的影响,提高了以此为基础的应答准确率,并且,节省了生成问答数据的人力和时间成本。

技术领域

本发明涉及计算机技术领域,尤其涉及一种问答数据生成方法及装置、存储介质。

背景技术

问答知识是以文本形式的知识为基础,通过语义分析、内容生成、语法梳理等过程得到的进一步结构化的知识。问答知识作为机器自动应答的基础,能够直接影响机器自动应答的准确程度。

目前,问答数据一般依赖于人工编辑的方式生成。也就是,由编辑人员阅读文件,并通过人工手动编写的方式,形成问答数据。但是,人工编辑问答数据带来大量的人力成本及时间成本的浪费,且受到编辑人员的主观影响较大,导致问答数据具备较严重的主观倾向,这导致以此为基础的机器问答存在应答准确度较低的问题。

发明内容

本发明提供一种问答数据生成方法及装置、存储介质,用以降低主观因素对问答数据的影响,以期提高以此为基础的应答准确率,并且,用以节省生成问答数据的人力和时间成本。

第一方面,本发明提供一种问答数据生成方法,包括:

对初始数据进行关键词预处理,得到关键词组与问答模板;

利用已训练好的第一机器学习模型与第二机器学习模型分别对所述关键词组与问答模板组进行处理,得到第一结果集与第二结果集;所述第一结果集用于指示与各关键词组对应的候选问答模板,所述第二结果集用于指示与各问答模板对应的候选关键词组;

对所述第一结果集与所述第二结果集进行匹配互选,得到互选结果;

根据所述互选结果,生成问答数据。

第二方面,本发明提供一种问答数据生成装置,包括:

预处理模块,用于对初始数据进行关键词预处理,得到关键词组与问答模板;

处理模块,用于利用已训练好的第一机器学习模型与第二机器学习模型分别对所述关键词组与问答模板组进行处理,得到第一结果集与第二结果集;所述第一结果集用于指示与各关键词组对应的候选问答模板,所述第二结果集用于指示与各问答模板对应的候选关键词组;

匹配模块,用于对所述第一结果集与所述第二结果集进行匹配互选,得到互选结果;

生成模块,用于根据所述互选结果,生成问答数据。

第三方面,本发明提供一种问答数据生成装置,包括:

存储器;

处理器;以及

计算机程序;

其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。

第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910387830.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top