[发明专利]一种基于语义的无监督常识问答方法及系统在审
申请号: | 202110567385.X | 申请日: | 2021-05-24 |
公开(公告)号: | CN113536809A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 黄民烈;牛艺霖 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/30;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 监督 常识 问答 方法 系统 | ||
1.一种基于语义的无监督常识问答方法,其特征在于,包括:
将原始常识问题转换为缺失答案部分的目标陈述句;
将所述目标陈述句输入到预训练语言模型中进行预测,生成多个支撑答案,所述支撑答案为所述目标陈述句中缺失的答案部分;
获取所述原始常识问题对应的多个预设候选答案,并对每个预设候选答案和每个支撑答案进行语义向量化处理,得到每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示;
根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,将满足预设条件的语义相似度对应的预设候选答案作为所述原始常识问题的目标答案。
2.根据权利要求1所述的基于语义的无监督常识问答方法,其特征在于,所述根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,包括:
基于语义相似度公式,计算预设候选答案和支撑答案之间的语义相似度,所述语义相似度公式为:
其中,ω(S|A)表示支撑答案S和预设候选答案A之间的相似度;T表示温度系数,用于控制相似度得分的分布;cos表示两个向量之间的余弦相似度,exp表示以e为基的指数函数,hS表示支撑答案S的语义向量表示,hA表示预设候选答案A的语义向量表示。
3.根据权利要求1所述的基于语义的无监督常识问答方法,其特征在于,所述根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,将满足预设条件的语义相似度对应的预设候选答案作为所述原始常识问题的目标答案,包括:
根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取每个预设候选答案和所有支撑答案之间的多个语义相似度,并对每个预设候选答案对应的多个语义相似度进行求和平均,获取每个预设候选答案的平均语义相似度;
将平均语义相似度最大值对应的预设候选答案作为原始常识问题的目标答案。
4.根据权利要求1所述的基于语义的无监督常识问答方法,其特征在于,所述预训练语言模型为GPT-2模型。
5.根据权利要求1所述的基于语义的无监督常识问答方法,其特征在于,所述对每个预设候选答案和每个支撑答案进行语义向量化处理,包括:
基于训练好的句子级语义表示模型,分别对预设候选答案和支撑答案进行语义向量化处理,得到对应的语义向量表示,所述训练好的句子级语义表示模型是通过对RoBERTa模型进行训练得到的。
6.一种基于语义的无监督常识问答系统,其特征在于,包括:
原始问题改写模块,用于将原始常识问题转换为缺失答案部分的目标陈述句;
支撑答案预测模块,用于将所述目标陈述句输入到预训练语言模型中进行预测,生成多个支撑答案,所述支撑答案为所述目标陈述句中缺失的答案部分;
语义向量处理模块,用于对每个预设候选答案和每个支撑答案进行语义向量化处理,得到每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示;
候选答案确定模块,用于根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,将满足预设条件的语义相似度对应的预设候选答案作为所述原始常识问题的目标答案。
7.根据权利要求6所述的基于语义的无监督常识问答系统,其特征在于,所述候选答案确定模块包括:
语义相似度计算单元,用于基于语义相似度公式,计算预设候选答案和支撑答案之间的语义相似度,所述语义相似度公式为:
其中,ω(S|A)表示支撑答案S和预设候选答案A之间的相似度;T表示温度系数,用于控制相似度得分的分布;cos表示两个向量之间的余弦相似度,exp表示以e为基的指数函数,hS表示支撑答案S的语义向量表示,hA表示预设候选答案A的语义向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110567385.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:虚拟对象的移动方法、设备及存储介质
- 下一篇:一种大气环境检测系统