[发明专利]一种基于语义的无监督常识问答方法及系统在审
申请号: | 202110567385.X | 申请日: | 2021-05-24 |
公开(公告)号: | CN113536809A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 黄民烈;牛艺霖 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/30;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 监督 常识 问答 方法 系统 | ||
本发明提供一种基于语义的无监督常识问答方法及系统,该方法包括:将原始常识问题转换为缺失答案部分的目标陈述句;将目标陈述句输入到预训练语言模型中进行预测,生成多个支撑答案;获取原始常识问题对应的多个预设候选答案,并对每个预设候选答案和每个支撑答案进行语义向量化处理,得到每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示;根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,将满足预设条件的语义相似度对应的预设候选答案作为原始常识问题的目标答案。本发明能够提升问答系统的准确率,提升对于单词级别攻击的抵抗能力。
技术领域
本发明涉及自然语言处理以及问答系统技术领域,尤其涉及一种基于语义的无监督常识问答方法及系统。
背景技术
随着人工智能的飞速发展,问答系统占据了越来越重要的地位。交互式机器人在逐渐成为我们生活的一部分,例如,微软的聊天机器人小冰和小米的人工智能音箱等,其中一项重要的技术就是问答系统,机器人需要根据用户的问题,结合掌握的知识,整合关键的信息,从而做出相应的判断和回答,方便用户从大量的信息中快速获取需要的答案。
随着问答系统的发展,机器的回答缺少常识逻辑成为了一个关键性问题,很多时候机器可能会给出荒谬的回答。此外,在实际应用中,很多情况下缺少人工标注的训练数据,而收集这类数据耗时耗力,因此,现在有许多基于无监督或者弱监督设定的问答方法及系统。然而,这些方法大多是根据问题和答案的字面特征做出判断,容易受到单词级别攻击的影响,导致得到的回答结果准确率较低。
因此,现在亟需一种基于语义的无监督常识问答方法及系统来解决上述问题。
发明内容
针对现有技术存在的问题,本发明提供一种基于语义的无监督常识问答方法及系统。
本发明提供一种基于语义的无监督常识问答方法,包括:
将原始常识问题转换为缺失答案部分的目标陈述句;
将所述目标陈述句输入到预训练语言模型中进行预测,生成多个支撑答案,所述支撑答案为所述目标陈述句中缺失的答案部分;
获取所述原始常识问题对应的多个预设候选答案,并对每个预设候选答案和每个支撑答案进行语义向量化处理,得到每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示;
根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,将满足预设条件的语义相似度对应的预设候选答案作为所述原始常识问题的目标答案。
根据本发明提供的一种基于语义的无监督常识问答方法,所述根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,包括:
基于语义相似度公式,计算预设候选答案和支撑答案之间的语义相似度,所述语义相似度公式为:
其中,ω(S|A)表示支撑答案S和预设候选答案A之间的相似度;T表示温度系数,用于控制相似度得分的分布;cos表示两个向量之间的余弦相似度,exp表示以e为基的指数函数,hS表示支撑答案S的语义向量表示,hA表示预设候选答案A的语义向量表示。
根据本发明提供的一种基于语义的无监督常识问答方法,所述根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取预设候选答案和支撑答案之间的语义相似度,将满足预设条件的语义相似度对应的预设候选答案作为所述原始常识问题的目标答案,包括:
根据每个预设候选答案的语义向量表示和每个支撑答案的语义向量表示,获取每个预设候选答案和所有支撑答案之间的多个语义相似度,并对每个预设候选答案对应的多个语义相似度进行求和平均,获取每个预设候选答案的平均语义相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110567385.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:虚拟对象的移动方法、设备及存储介质
- 下一篇:一种大气环境检测系统