[发明专利]一种问句推荐方法及系统有效
申请号: | 201710908123.9 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107704563B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 徐波 | 申请(专利权)人: | 广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/36 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问句 推荐 方法 系统 | ||
1.一种问句推荐方法,其特征在于:包括以下步骤:
S1:接收语料数据,所述语料数据为多回合的问答数据;
S2:将语料数据转化生成正例对,所述正例对为正确的“问题-答案”组成的问答对,或由正确顺序的“问题-下一个问题”组成的问题对;
通过随机采样与所述语料数据结合生成反例对,所述反例对为错误的“问题-答案”组成的问答对,或由错误顺序的“问题-下一个问题”组成的问题对;
或者,所述正例对为:由语料问题与问答库中的相似的问题组成的“问题-问题”问题对;所述反例对为:由语料问题与问答库中不相同的问题组成的“问题-问题”问题对;
S3:通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;
S4:将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;
S5:将新的句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;
S6:对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型;所述预测模型,用于根据接收的用户问句,获取问句答案或下一个问题;对用户提的问题,利用所述预测模型预测答案或问题可能提的下一个问题。
2.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S3中,具体为:将句子进行分词,然后对每个词进行向量化处理,最后再合并成句子向量矩阵。
3.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S3中,具体为:对句子中的每个字进行向量化处理,然后再合并成句子向量矩阵。
4.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S5具体包括:
S51:通过在卷积神经网络中设置多个过滤器,每个过滤器的输出结果为一个列向量;
S52:将每个列向量输入到池化层中,输出每个列向量中的最大元素;
S53:将池化层中输出的元素合并成一个向量,即该句子的语义向量。
5.根据权利要求1所述问句推荐方法,其特征在于:所述步骤S6中具体包括步骤:
S61:通过设置相似度阈值方式判断正例对的余弦相似度和反例对的余弦相似度的差值是否满足要求;具体的模型损失函数为:L=max{0,m-cos(QV1,QV2)+cos(QV1,QV2-)};其中,所述QV1和QV2的组合为正例对的语义向量组;所述QV1和QV2-的组合为反例对的语义向量组,所述QV1和所述QV2为句子对的向量表示;所述m为设定的相似度阈值;
S62:通过训练优化该损失函数,使得该损失函数L数值最小,最后获取预测模型。
6.一种问句推荐系统,其特征在于:包括
语料接收模块,用于接收语料数据,所述语料数据为多回合的问答数据;
正例对生成模块,用于将语料数据转化生成正例对,所述正例对为正确的“问题-答案”组成的问答对,或由正确顺序的“问题-下一个问题”组成的问题对;或者,所述正例对为:由语料问题与问答库中的相似的问题组成的“问题-问题”问题对;
反例对生成模块,用于通过随机采样与所述语料数据结合生成反例对,所述反例对为错误的“问题-答案”组成的问答对,或由错误顺序的“问题-下一个问题”组成的问题对;或者,所述反例对为:由语料问题与问答库中不相同的问题组成的“问题-问题”问题对;
句子向量矩阵获取模块,用于通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;
点积计算模块,用于将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;
句子语义向量获取模块,用于将新的句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;
预测模型获取模块,用于对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型;所述预测模型,用于根据接收的用户问句,获取问句答案或下一个问题;对用户提的问题,利用所述预测模型预测答案或问题可能提的下一个问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司,未经广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710908123.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:搅拌杯(A034‑A035)
- 下一篇:酸奶机(USB迷你)