[发明专利]基于学科知识图谱和卷积神经网络的智能答疑方法有效
| 申请号: | 202010083679.0 | 申请日: | 2020-02-10 |
| 公开(公告)号: | CN111324709B | 公开(公告)日: | 2021-08-13 |
| 发明(设计)人: | 朱新华;龚云;陈宏朝;张兰芳 | 申请(专利权)人: | 广西师范大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/36;G06N3/04 |
| 代理公司: | 南宁东智知识产权代理事务所(特殊普通合伙) 45117 | 代理人: | 巢雄辉;裴康明 |
| 地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 学科 知识 图谱 卷积 神经网络 智能 答疑 方法 | ||
1.一种基于知识图谱和神经网络的智能答疑方法,其特征在于包括以下步骤:
S1.使用用户问句q中的每个汉字,检索领域本体中包含该汉字的概念,形成用户问句q指向领域本体的候选概念集合ConSet;
S2.通过候选概念集合ConSet及其与问句q基于字表面的相似度,自动识别用户问句q中的概念提及,形成用户问句q指向领域本体排名前N的候选概念集合TOP(N),以及在问句q中相对应的概念提及集合M(N);
S3.从概念提及集合M(N)中选择一个概念提及m,逐一检索m在TOP(N)中对应候选概念c的每一个形如t(c,r)的概念关系对,通过基于字表面的问句q与候选概念c的相似度sim(q,c)、基于标准卷积神经网络的概念提及m与候选概念c之间的相似度sim(c,m)、基于多级蕴涵卷积神经网络的问句q与语义关系r的相似度sim(q,r),计算得出用户问句q与候选概念c的所有概念关系对的相似度;
S4.重复步骤S3,直至集合M(N)中的每个概念提及被处理完毕,并将通过步骤S3得到的与用户问句q相似度值最大的概念关系对t(c’,r’)作为答案知识源;
S5.在学科知识图谱的关系记录库中查询概念关系对t(c’,r’),得到用户问句q的答案并呈现给用户;
其中,所述步骤S2包括如下子步骤:
2.1计算ConSet中的每一个候选概念c与用户问句q的最长连续公共子序列LCCS(c,q):
LCCS(c,q)=∪i≤|c|{s(i)∈c∩q|s(i)是s(i-1)在c中的后继}
2.2通过最长连续公共子序列LCCS(c,q),计算在ConSet中的每一个候选概念c与用户问句q的基于字表面的相似度sim(q,c):
保留相似度排名前N的候选概念,形成用户问句q在领域本体排名前N的候选概念集合TOP(N);
2.3对于集合TOP(N)中的每一个候选概念c与用户问句q的最长连续公共子序列LCCS(c,q),按如下方法进行扩展,形成用户问句q的N个概念提及集合M(N):如果LCCS(c,q)与对应的候选概念c的长度相同,则c就是用户问句q的一个概念提及;如果c比其LCCS(c,q)更长并且在左边有L1个汉字,或c比LCCS(c,q)更长并且在右边有L2个汉字,则在问句q中逐字扩展LCCS(c,q)左侧L1个汉字或右侧L2个汉字,直到在问句q中出现c的左边界字或右边界字为止,此时扩展后的LCCS(c,q)就是c在q中对应的概念提及;所述用户问句q的一个概念提及是指q中可能包含的一个提问概念;
所述步骤S3中,标准神经网络的处理过程包括:
3.1.1使用标准卷积神经网络S_CNN的输入层来统一处理文本片段,形成文本片段的输入特征矩阵,所述文本片段包括概念提及、领域本体中的候选概念,以及关系成份中的概念类型、主题与媒体类型;
3.1.2S_CNN通过卷积层从所述文本片段中提取n-grams特征,产生n-gram特征的语义向量;
3.1.2将所有的n-gram特征的语义向量通过逐行最大池化输出所述文本片段的语义向量,包括领域本体中的候选概念、概念提及、概念类型、主题与媒体类型的语义向量vc、vm、vr1、vr2与vr3;
所述步骤3.1.1包括:S_CNN的输入层将长度为s个汉字的输入序列x转换为维度为d×s的实数特征矩阵,其中d表示每个汉字随机初始化的实数嵌入向量的维数,且所述实数特征矩阵等价于s个维度为d的向量序列:v1,v2,…,vs;
所述步骤3.1.2包括:S_CNN通过一个卷积层从滑动的n-gram中进行语义向量学习,对于长度为s个汉字的输入序列x:v1,v2,…,vs,令向量ci∈Rnd表示如下n个汉字嵌入向量的联接嵌入:vi-n+1,...,vi,其中n为卷积滑动过滤器filter的宽度,Rnd表示维度为n*d的实数向量集合,i为n-gram在输入序列x中的结束位置,且有0<i<s+n,以及对于i<1或i>s的嵌入向量vi使用零值填充;卷积层使用卷积权重W∈Rd×nd为n-gram的向量序列vi-n+1,...,vi产生一个n-gram特征的语义向量pi∈Rd,计算公式如下:
pi=tanh(W·ci+b)
其中,偏置b∈Rd,Rd表示维度为d的实数向量集合,Rd×nd表示维度为d行、n*d列的实数矩阵集合,tanh(·)为双曲正切函数;
所述步骤3.1.3包括:将所有n-gram特征的语义向量pi,其中i=1,...,s+n-1,通过最大池化生成输入序列x的语义向量vx∈Rd,计算公式如下:
vx={xj∈R|j=1,...,d}
xj=max{pi(j)|i=1,...,s+n-1}
其中,max{·}表示求最大值,pi(j)表示pi中的第j个元素,R表示实数集合,xj表示所有pi中第j个元素的最大值;
所述步骤S3中,多级蕴涵卷积神经网络MI_CNN的处理过程包括:
步骤3.2.1和步骤3.2.2分别采用与步骤3.1.1和3.1.2相同的方法处理关系成份中的概念类型、主题与媒体类型的语义特征,得到相对应的关系成份语义向量vr1、vr2与vr3;
3.2.3根据语义向量vr1、vr2与vr3,采用多级蕴涵卷积神经网络MI_CNN的三级池化过程,分别输出与关系成份概念类型、主题与媒体类型相对应的问句语义向量vq1、va2与vq3:
(1)设Fq∈Rd×(s+n-1)表示问句q经MI_CNN卷积层处理后生成的n-gram特征矩阵,o为问句q所要匹配的关系成份,vo∈Rd表示经S_CNN处理得到的关系成份o的语义向量,MI_CNN的每一级池化过程首先计算Fq中每一列与vo的余弦相似度ui,并将其中的最大值作为问句q对关系成份o的蕴涵度,记作计算过程如下:
Fq={pi∈Rd|i=1,...,s+n-1}
pi={tji∈R|j=1,...,d}
ui=cos(vo,pi)
其中,tji为第i个n-gram特征的语义向量pi的第j维度上的值;
(2)利用问句q对关系成份o的蕴涵度对Fq中每一列的特征值进行衰减,并将与vo的相似度值为负的列的向量值置为0,得到衰减后的问句特征矩阵F′q,计算过程如下:
F′q={p′i∈Rd|i=1,...,s+n-1}
p′i={t′ji∈R|j=1,...,d}
其中,p′i表示衰减后的pi向量,t′ji表示p′i向量的第j维度上的值;
(3)根据衰减后特征矩阵F′q中每一行最大值的位置检索特征矩阵Fq,得到Fq每一行的池化结果,并最终得到每一级池化后问句q的语义向量vq∈Rd,计算过程如下:
vq={qj∈R|j=1,...,d}
qj=pk′(j)
k=arg max{pk(j)|k=1,...,s+n-1}
其中,arg max{p′k(j)|k=1,...,s+n-1}表示求使得p′k(j)为最大值的k,qj表示vq向量的第j个元素,p′k(j)表示p′k的第j个元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010083679.0/1.html,转载请声明来源钻瓜专利网。





