[发明专利]问答推理方法、装置、存储介质及电子设备有效
申请号: | 202110659490.6 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113392197B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 杨霞;常毅;田原 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N5/04 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 张晓芳 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 推理 方法 装置 存储 介质 电子设备 | ||
1.一种问答推理方法,其特征在于,所述方法包括:
获取问题实体;
确定所述问题实体对应的参考实体,基于所述参考实体从知识图谱中获取所述问题实体对应的候选答案集合;其中,所述知识图谱至少包括多个实体以及任意两个实体之间的关系,所述参考实体为所述知识图谱包括的多个实体中的任意一个实体,所述候选答案集合包括所述问题实体对应的多个候选答案实体以及任意两个候选答案实体之间的关系,所述多个候选答案实体为与所述参考实体关联的实体;所述问题实体与所述参考实体存在对应关系;
从所述候选答案集合中确定所述问题实体对应的目标答案实体;
所述从所述候选答案集合中确定所述问题实体对应的目标答案实体,包括:
通过语言模型BERT对所述候选答案集合和所述问题实体进行初始化处理,生成候选实体特征、整体问题特征、问题实体特征和关系特征;其中,所述候选实体特征是指所述候选答案实体对应的特征,所述整体问题特征是指所有的问题实体对应的特征,所述问题实体特征是指每个问题实体对应的特征,所述关系特征是指任意两个候选答案实体之间的关系对应的特征;
基于所述候选实体特征、所述整体问题特征、所述问题实体特征和所述关系特征从所述候选答案集合中筛选预测答案实体;其中,所述预测答案实体为与所述问题实体的关联性超过预设阈值的多个候选答案实体;
基于所述预测答案实体确定目标答案实体。
2.根据权利要求1所述的方法,其特征在于,所述确定所述问题实体对应的参考实体,基于所述参考实体从知识图谱中获取所述问题实体对应的候选答案集合,包括:
通过预先训练好的提取模型确定所述问题实体对应的参考实体;
从所述知识图谱中获取所述参考实体的相邻实体;其中,所述相邻实体为所述候选答案集合中与所述参考实体直接关联的实体;
基于所述相邻实体生成候选答案集合。
3.根据权利要求1所述的方法,其特征在于,所述确定所述问题实体对应的参考实体,基于所述参考实体从知识图谱中获取所述问题实体对应的候选答案集合,包括:
通过预先训练好的提取模型确定所述问题实体对应的参考实体;
从所述知识图谱中确定所述问题实体与所述参考实体之间的连接路径;
基于所述连接路径上的实体生成候选答案集合。
4.根据权利要求1所述的方法,其特征在于,所述基于所述候选实体特征、所述整体问题特征、所述问题实体特征和所述关系特征从所述候选答案集合中筛选预测答案实体,包括:
通过如下公式更新所述候选实体特征:
其中,vq表示问题实体,r表示所述两个候选答案实体之间的关系,vi表示所述候选答案实体,Xq表示问题实体集合,表示第l层的候选实体特征,l表示预先训练好的神经网络FFN()的当前层数,l为大于1的正整数,表示第l-1层的候选实体特征,表示第l层的整体问题特征,f(l)()表示第l层的问题实体、关系和候选答案实体之间的连接特征,∑表示累积求和;
解析更新后的所述候选实体特征确定对应的预测答案实体。
5.根据权利要求1所述的方法,其特征在于,所述基于所述预测答案实体确定目标答案实体,包括:
计算各预测答案实体对应的似然估计;
确定最大的似然估计,基于所述最大的似然估计确定目标答案实体。
6.根据权利要求5所述的方法,其特征在于,所述似然估计通过如下公式进行计算:
其中,LA表示vt对应的似然估计,表示目标答案实体为vt时对应的标签,y()表示标签函数,所述标签为0或者1,vt表示第t个预测答案实体,n表示预测答案实体的数量,t、n为大于1的整数,Xq表示问题实体集合,p()表示概率函数,log()表示对数函数,∑表示累积求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110659490.6/1.html,转载请声明来源钻瓜专利网。