[发明专利]一种智能问答方法及其系统在审
| 申请号: | 201711061534.5 | 申请日: | 2017-11-02 |
| 公开(公告)号: | CN107818164A | 公开(公告)日: | 2018-03-20 |
| 发明(设计)人: | 张邦佐;武志远;孙小新;冯国忠 | 申请(专利权)人: | 东北师范大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04;G10L15/26 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 130024 吉林*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 智能 问答 方法 及其 系统 | ||
1.一种智能问答方法,其特征在于,包括如下步骤:
步骤S1、建立相关领域的知识图谱;
步骤S2、将用户问题的语音转化成文本;
步骤S3、使用skip-gram模型将文本向量化,生成问题向量矩阵;
步骤S4、使用卷积神经网络将问题向量矩阵生成问题特征向量;
步骤S5、计算用户问题特征向量与候选答案特征向量的相似度;
步骤S6、通过排序学习反馈给用户答案。
2.如权利要求1所述的智能问答方法,其特征在于,步骤S1中,知识图谱的建立包括如下步骤:
步骤R1、对高价值信息进行检测,抽取数据块;
步骤R2、将自然语言文本中的信息与知识库中的条目进行链接;
步骤R3、对自然语言文本进行开放抽取,获取相应的三元组;
步骤R4、将抽取的三元组进行验证集成。
3.如权利要求1所述的智能问答方法,其特征在于,步骤S3中,skip-gram模型将文本向量化时,对于给定单词序列w1,w2,...,wn,该模型的优化目标公式如下:
式中,p表示第t+j个词在t个词出现的情况下出现的概率;c是训练上下文的长度;
skip-gram模型使用softmax函数来优化参数,优化公式如下:
式中,νw是单词w的输入向量;ν’w是单词w的输出向量;W是词表中单词的数量。
4.如权利要求3所述的智能问答方法,其特征在于,skip-gram模型优化参数的方法包括:层次softmax、负采样和二次采样中的一种或多种。
5.如权利要求1所述的智能问答方法,其特征在于,步骤S4包括如下子步骤:
步骤T1、将问题向量矩阵用二元卷积神经网络生成卷积神经网络;
步骤T2、问题向量矩阵经第一卷积层、第一采样层、第二卷积层和第二采样层后变换到输出层,生成问题向量。
6.如权利要求5所述的智能问答系统,其特征在于,问题向量生成模型的训练目标公式如下:
L=max(mar-xT·x++xT·x-)+(公式3)
其中,x为由卷积神经网络生成的问题向量;x+为与向量x属于同一类的抽样向量;x-为不属于向量x所属类的抽样向量。
7.如权利要求5所述的智能问答方法,其特征在于,问题向量矩阵经由第二采样层变换到输出层的函数如下公式所示:
x=W0tanh(y)(公式4)
其中,x表示输出向量;y表示第二采样层向量;W0表示加权变换时的权值信息。
8.如权利要求1所述的智能问答方法,其特征在于,步骤S5中,在问题特征向量与候选答案特征向量进行比较时,进行相似度打分,包括问题特征向量相似度打分、问题特征向量与所有答案向量的相似度打分。
9.如权利要求8所述的智能问答方法,其特征在于,问题特征向量与所有答案向量的相似度打分的公式如下:
r'=v·M'·c(公式5)
其中,r’是结果向量,维度与已知答案的格式k相同;ν是待测评问句向量;M’是一个n×k维矩阵,每一列表示一个已知答案的答案向量;C是一个k维向量,向量中每一维表示该维所对应的结果中关键字与问题关键字的相似程度。
10.一种智能问答系统,其特征在于,包括:
知识建立模块,用于建立相关领域的知识图谱;
语音转化模块,用于将用户问题的语音转化为文本;
问题向量矩阵生成模块,用于使用skip-gram模型将文本向量化,生成问题向量矩阵;
问题特征向量生成模块,用于使用卷积神经网络将问题向量矩阵生成问题特征向量;
相似度对比模块,用于计算用户问题特征向量与候选答案特征向量的相似度;
答案生成模块,用于通过排序学习反馈给用户答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北师范大学,未经东北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711061534.5/1.html,转载请声明来源钻瓜专利网。





