[发明专利]问题内容匹配方法及装置在审
| 申请号: | 202011289410.4 | 申请日: | 2020-11-18 | 
| 公开(公告)号: | CN112100340A | 公开(公告)日: | 2020-12-18 | 
| 发明(设计)人: | 李飞阳;陈建国;胡鸣鹤;薛娇;熊杰 | 申请(专利权)人: | 智者四海(北京)技术有限公司 | 
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F16/35 | 
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何明伦 | 
| 地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 问题 内容 匹配 方法 装置 | ||
本公开提供了一种问题内容匹配方法及装置,其中,方法包括根据内容对问题进行多角度召回,并对召回的问题进行粗排序,获得所述内容相对应的问题集合;根据所述内容及其对应的问题集合,通过预训练模型获得多个问题内容对的表征向量;通过神经网络模型获得所述表征向量的预测分数,根据所述预测分数获得所述内容对应的目标问题。
技术领域
本公开涉及智能匹配技术领域,更具体地,涉及一种问题内容匹配方法及装置。
背景技术
在很多自然语言识别场景下,都需要进行文本匹配,但是目前的文本智能匹配算法中,是将两个文本当做平等内容进行相关度计算匹配,无法识别出两个文本之间的内在联系,并不适用于问题与答案之间的场景。
发明内容
有鉴于此,本公开提供了一种问题内容匹配方法、装置、电子设备及计算机可读介质,其能够至少部分地解决或缓解现有技术的上述问题。
按照本公开内容的第一方面,本公开提供了一种问题内容匹配方法,包括:根据内容对问题进行多角度召回,并对召回的问题进行粗排序,获得内容相对应的问题集合;根据内容及其对应的问题集合,通过预训练模型获得多个问题内容对的表征向量;通过神经网络模型获得表征向量的预测分数,根据预测分数获得内容对应的目标问题。
优选地,根据内容对问题进行多角度召回包括以下至少一个:根据内容的标题直接搜索召回;根据内容的分类进行召回;根据内容的关键词进行召回;根据内容的话题进行召回。
优选地,对召回的问题进行粗排序包括:根据内容与问题的相关度以及问题的页面浏览量对召回的问题进行粗排序。
优选地,预训练模型为Bert模型,问题内容对依次包括问题标题、问题描述、内容标题、内容描述,且在问题和内容之间还设置有分割标志。
优选地,问题内容匹配方法还包括:根据预测分数获得神经网络模型的负样本,通过迭代训练,优化神经网络模型。
优选地,神经网络模型为单层神经网络模型。
按照本公开内容的第二方面,本公开提供了一种问题内容匹配方法,包括:根据问题对内容进行多角度召回,并对召回的内容进行粗排序,获得问题相对应的内容集合;根据问题及其对应的内容集合,通过预训练模型获得多个问题内容对的表征向量;通过神经网络模型获得表征向量的预测分数,根据预测分数获得问题对应的目标内容。
优选地,根据问题对内容进行多角度召回包括以下至少一个:根据问题的分类进行召回;根据问题的话题进行召回。
按照本公开内容的第三方面,本公开提供了一种问题内容匹配装置,包括:召回问题模块,被配置为用于根据内容对问题进行多角度召回,并对召回的问题进行粗排序,获得内容相对应的问题集合;第一问题内容组合模块,被配置为用于根据内容及其对应的问题集合,通过预训练模型获得多个问题内容对的表征向量;目标问题获取模块,被配置为用于通过神经网络模型获得表征向量的预测分数,根据预测分数获得内容对应的目标问题。
按照本公开内容的第四方面,本公开提供了一种问题内容匹配装置,包括:召回内容模块,被配置为用于根据问题对内容进行多角度召回,并对召回的内容进行粗排序,获得问题相对应的内容集合;第二问题内容组合模块,被配置为用于根据问题及其对应的内容集合,通过预训练模型获得多个问题内容对的表征向量;目标内容获取模块,被配置为用于通过神经网络模型获得表征向量的预测分数,根据预测分数获得问题对应的目标内容。
按照本公开内容的第五方面,本公开提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如第一方面或第二方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智者四海(北京)技术有限公司,未经智者四海(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011289410.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





