[发明专利]一种问题匹配方法和装置有效
申请号: | 201611192472.7 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106815311B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 陈海波;李晓燕 | 申请(专利权)人: | 杭州朗和科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问题 匹配 方法 装置 | ||
1.一种问题匹配方法,包括:
接收用户提交的问题;
针对预设的每个问题集,计算该问题集与用户提交的问题的相似度;
若所述相似度大于设定相似度阈值,确定该问题集中的待匹配问题与用户提交的问题相匹配;
其中,同一问题集中保存至少两个针对同一答案的待匹配问题;
其中,计算该问题集与用户提交的问题的相似度,包括:
计算该问题集中每个待匹配问题与用户提交的问题的相似度,其中,计算该问题集中每个待匹配问题与用户提交的问题的相似度,具体包括:获得用户词序列和每个待匹配问题的词序列,分别将用户词序列与每个待匹配问题对应的待匹配词序列作为预设深度学习模型的输入,确定所述预设深度学习模型的输出;将所述预设深度 学习模型的输出作为该待匹配问题与用户提交的问题的相似度;
其中,所述深度学习模型中包括输入层、词嵌入层、卷积层、池化层、线性层1、sigmoid层1、线性层2和sigmoid层2;
所述输入层用于分别将所述用户词序列和所述待匹配词序列转化为对应的索引序列;所述词嵌入层用于根据所述用户词序列对应的索引序列生成用户问题矩阵,以及根据所述待匹配词序列对应的索引序列生成待匹配问题矩阵;所述卷积层用于分别对所述用户问题矩阵和所述待匹配问题矩阵进行卷积处理;所述池化层用于分别对经过所述卷积层处理后的所述用户问题矩阵和所述待匹配问题矩阵进行池化处理,以得到对应的向量结果;所述线性层1用于对所述用户问题矩阵对应的向量结果和所述待匹配问题矩阵对应的向量结果进行拼接处理;所述sigmoid层1用于对所述线性层1的输出结果进行非线性处理;所述线性层2用于对所述sigmoid层1的输出结果进行矩阵相乘处理,以得到结果数值;所述sigmoid层2用于对所述结果数值进行非线性处理以得到所述待匹配问题与所述用户提交的问题的相似度;
根据该问题集中每个待匹配问题与用户提交的问题的相似度,计算该问题集与用户提交的问题的相似度;
其中,采用如下公式,计算该问题集与用户提交的问题的相似度:
其中,probi(Q,Pi)表示问题集Pi与用户提交的问题Q的相似度,M表示问题集Pi中的待匹配问题的个数,probi(Q,Pij)表示问题集Pi中的问题j与用户提交的问题Q的相似度。
2.根据权利要求1所述的方法,其中,获得用户词序列和每个待匹配问题的词序列,包括:
对用户提交的问题进行分词处理,得到用户词序列;
针对该问题集中的每个待匹配问题,对该待匹配问题进行分词处理,得到该待匹配问题对应的待匹配词序列。
3.根据权利要求2所述的方法,其中,采用如下方式训练得到预设深度学习模型:
利用待训练深度学习模型,分别计算样本问题r与各个预设问题集的相似度;
将当前样本问题r与各个预设问题集的相似度作为预设损失函数的输入,确定预设损失函数的输出;
判断所述预设损失函数的输出是否小于设定损失阈值;
若否,根据所述预设损失函数的输出对待训练深度学习模型中的参数进行更新,将所述待训练深度学习 模型替换为参数更新后的待训练深度学习模型,并令r=r+1后,继续执行上述利用待训练深度学习模型,分别计算样本问题r与各个预设问题集的相似度的步骤;
若是,确定所述待训练深度学习模型为预设深度学习模型。
4.根据权利要求3所述的方法,其中,预设损失函数为:
其中,probi(r,Pi)表示问题集Pi与样本问题r的相似度,M表示问题集Pi中的待匹配问题的个数,probi(r,Pij)表示问题集Pi中的问题j与样本问题r的相似度,N表示问题集的个数,ti等于0 或1,当ti=0时表明样本问题r为负样本,当ti=1时表明样本问题r为正样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州朗和科技有限公司,未经杭州朗和科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611192472.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对海量文档集的层次聚类方法及系统
- 下一篇:一种驾驶员评价方法及装置