[发明专利]一种问句推荐方法及系统有效
申请号: | 201710908123.9 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107704563B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 徐波 | 申请(专利权)人: | 广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/36 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 问句 推荐 方法 系统 | ||
本发明提供一种问句推荐方法,包括以下步骤:S1:接收语料数据,所述语料数据为多回合的问答数据;S2:将语料数据转化生成正例对,通过随机采样与所述语料数据结合生成反例对;S3:通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;S4:将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;S5:将句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;S6:对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型。本发明还提供了一种用于实现上述方法的问句推荐系统。
技术领域
本发明涉及人工智能领域,特别是一种问句推荐方法及系统。
背景技术
在现有的问答系统中,通常先由用户提出一个问题,然后再由系统将给出一个答案。这种方式,系统经常是被动的根据用户的问题,寻找答案的。请参阅图1,其为现有的问句匹配方法的流程图。现有通常采用基于关键字的问句匹配方法进行问句匹配,具体步骤流程如下:
1)对玩家提交的问句进行分词以及词性标注
2)使用停用词表过滤掉问句中的停用词
3)对玩家提交的问句进行分类,确定问题类型
4)依据问句类型,对关键词进行适当的扩展
5)把关键词分为一般性关键词和“必须含有”的关键词,并对关键词附加不同的权重依据关键词到预先构建好的问答库中去匹配相似问句。
然而,对于现有的问句匹配方法来说,仍然存在以下缺陷:
1、难以正确选择好关键词。
2、难以确定关键词的权重
3、扩展关键词虽然提高了系统的召回率,但如果扩展不适当会极大地降低了检索的正确率。
4、关键词存在一词多义时,问句匹配准确率不高。
5、对于较复杂的问句,系统依靠关键词难以判断用户的真正意图。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供了一种问句推荐方法和系统。
本发明通过以下的方案实现:一种问句推荐方法,包括以下步骤:
S1:接收语料数据,所述语料数据为多回合的问答数据;
S2:将语料数据转化生成正例对,所述正例对为正确的“问题-答案”组成的问答对,或由正确顺序的“问题-下一个问题”组成的问题对;
通过随机采样与所述语料数据结合生成反例对,所述反例对为错误的“问题-答案”组成的问答对,或由错误顺序的“问题-下一个问题”组成的问题对;
或者,所述正例对为:由语料问题与问答库中的相似的问题组成的“问题-问题”问题对;所述反例对为:由语料问题与问答库中不相同的问题组成的“问题-问题”问题对;
S3:通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;
S4:将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;
S5:将句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;
S6:对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型;所述预测模型,用于根据接收的用户问句,获取问句答案或下一个问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司,未经广州多益网络股份有限公司;多益网络有限公司;广东利为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710908123.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:搅拌杯(A034‑A035)
- 下一篇:酸奶机(USB迷你)