[发明专利]问答语料生成方法及系统在审
申请号: | 201911004179.7 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110727782A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 陈海龙;杜斌 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/335;G06F16/33 |
代理公司: | 11400 北京商专永信知识产权代理事务所(普通合伙) | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体节点 语料 图谱 目标实体 实体卡片 实体元素 卡片 机器处理 人工成本 语料生成 录入 匹配 标准化 | ||
1.一种问答语料生成方法,包括:
获取问句实体元素;
从知识图谱中确定与所获取的问句实体元素相匹配的至少一个目标实体卡片,所述知识图谱包括多个实体卡片,所述实体卡片包括多个实体节点和关于不同实体节点之间的边连接;
基于所确定的目标实体卡片中的实体节点和边连接的内容,生成问答语料。
2.如权利要求1所述的方法,其中,所述获取问句实体元素包括:
获取问句模板;
按照模板实体元素提取条件,从所述问句模板中提取所述问句实体元素。
3.如权利要求2所述的方法,其中,所述获取问句模板包括:
获取至少一个候选问句模板;
针对各个候选问句模板,确定该候选问句模板是否满足所述模板实体元素提取条件;以及
在所述候选问句模板中选择满足所述模板实体元素提取条件的问句模板。
4.如权利要求2或3所述的方法,还包括:
获取问答模板对,每一问答模板对包括具有针对同一问句实体元素的槽位的问句模板和答案模板;
其中,所述基于所确定的目标实体卡片中的实体节点和边连接的内容,生成问答语料包括:
基于所确定的目标实体卡片中的实体节点和边连接的内容对所述问句模板进行填槽,以生成针对所述问句实体元素的问句语句;
基于所确定的目标实体卡片中的实体节点和边连接的内容对所述答案模板进行填槽,以生成针对所述问句实体元素的答案语句;
基于所述问句语句和所述答案语句生成问答语料。
5.如权利要求4所述的方法,其中,针对同一问句实体元素存在多个问答模板对。
6.如权利要求1所述的方法,其中,所述问句实体元素包括实体类别。
7.如权利要求1所述的方法,其中,所述问答语料包括以下中的至少一种语料类型:文本语料、语音语料和视频语料。
8.一种问答语料生成系统,包括:
实体元素获取单元,被配置为获取问句实体元素;
目标卡片确定单元,被配置为从知识图谱中确定与所获取的问句实体元素相匹配的至少一个目标实体卡片,所述知识图谱包括多个实体卡片,所述实体卡片包括多个实体节点和关于不同实体节点之间的边连接;
问答语料生成单元,被配置为基于所确定的目标实体卡片中的实体节点和边连接的内容,生成问答语料。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004179.7/1.html,转载请声明来源钻瓜专利网。