[发明专利]一种问句推荐方法及系统有效

专利信息
申请号: 201710908123.9 申请日: 2017-09-29
公开(公告)号: CN107704563B 公开(公告)日: 2021-05-18
发明(设计)人: 徐波 申请(专利权)人: 广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06F16/36
代理公司: 广州骏思知识产权代理有限公司 44425 代理人: 吴静芝
地址: 510530 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 问句 推荐 方法 系统
【权利要求书】:

1.一种问句推荐方法,其特征在于:包括以下步骤:

S1:接收语料数据,所述语料数据为多回合的问答数据;

S2:将语料数据转化生成正例对,所述正例对为正确的“问题-答案”组成的问答对,或由正确顺序的“问题-下一个问题”组成的问题对;

通过随机采样与所述语料数据结合生成反例对,所述反例对为错误的“问题-答案”组成的问答对,或由错误顺序的“问题-下一个问题”组成的问题对;

或者,所述正例对为:由语料问题与问答库中的相似的问题组成的“问题-问题”问题对;所述反例对为:由语料问题与问答库中不相同的问题组成的“问题-问题”问题对;

S3:通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;

S4:将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;

S5:将新的句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;

S6:对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型;所述预测模型,用于根据接收的用户问句,获取问句答案或下一个问题;对用户提的问题,利用所述预测模型预测答案或问题可能提的下一个问题。

2.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S3中,具体为:将句子进行分词,然后对每个词进行向量化处理,最后再合并成句子向量矩阵。

3.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S3中,具体为:对句子中的每个字进行向量化处理,然后再合并成句子向量矩阵。

4.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S5具体包括:

S51:通过在卷积神经网络中设置多个过滤器,每个过滤器的输出结果为一个列向量;

S52:将每个列向量输入到池化层中,输出每个列向量中的最大元素;

S53:将池化层中输出的元素合并成一个向量,即该句子的语义向量。

5.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S6中具体包括步骤:

S61:通过设置相似度阈值方式判断正例对的余弦相似度和反例对的余弦相似度的差值是否满足要求;具体的模型损失函数为:L=max{0,m-cos(QV1,QV2)+cos(QV1,QV2-)};其中,所述QV1和QV2的组合为正例对的语义向量组;所述QV1和QV2-的组合为反例对的语义向量组,所述QV1和所述QV2为句子对的向量表示;所述m为设定的相似度阈值;

S62:通过训练优化该损失函数,使得该损失函数L数值最小,最后获取预测模型。

6.一种问句推荐系统,其特征在于:包括

语料接收模块,用于接收语料数据,所述语料数据为多回合的问答数据;

正例对生成模块,用于将语料数据转化生成正例对,所述正例对为正确的“问题-答案”组成的问答对,或由正确顺序的“问题-下一个问题”组成的问题对;或者,所述正例对为:由语料问题与问答库中的相似的问题组成的“问题-问题”问题对;

反例对生成模块,用于通过随机采样与所述语料数据结合生成反例对,所述反例对为错误的“问题-答案”组成的问答对,或由错误顺序的“问题-下一个问题”组成的问题对;或者,所述反例对为:由语料问题与问答库中不相同的问题组成的“问题-问题”问题对;

句子向量矩阵获取模块,用于通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;

点积计算模块,用于将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;

句子语义向量获取模块,用于将新的句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;

预测模型获取模块,用于对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型;所述预测模型,用于根据接收的用户问句,获取问句答案或下一个问题;对用户提的问题,利用所述预测模型预测答案或问题可能提的下一个问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司,未经广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710908123.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top