[发明专利]基于双向长短期记忆神经网络的智能自动问答方法及系统在审
申请号: | 201811478881.2 | 申请日: | 2018-12-05 |
公开(公告)号: | CN109299478A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 冯俊龙;刘妍;周超然;张昕;冯欣;赵建平;张剑飞;张婧;孙庚 | 申请(专利权)人: | 长春理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332;G06F16/335;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 程华 |
地址: | 130000 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 记忆神经网络 自动问答 智能 匹配 用户目标向量 目标向量 用户问题 特征词 相似度 数据库 矩阵 语义 核心特征 获取信息 矩阵输入 问题答案 问题文本 构建 向量 答案 转化 | ||
1.一种基于双向长短期记忆神经网络的智能自动问答方法,其特征在于,所述智能自动问答方法包括:
对所有自动问答数据中的问题文本进行切词与向量转化处理,使每一个所述问题文本均转化成一个问题矩阵;
构建双向长短期记忆神经网络模型;
将所述问题矩阵依次输入到所述双向长短期记忆神经网络模型中,所述双向长短期记忆神经网络模型依次输出所述问题矩阵对应的目标向量,并将所有所述目标向量存储到智能自动问答数据库中;所述智能自动问答数据库包括问题文本、问题文本对应的目标向量以及问题文本对应的问题答案;
获取用户输入问题文本;
对所述用户输入问题文本进行切词与向量转化处理,得到特征词和用户问题矩阵;
从所述智能自动问答数据库中提取与所述特征词相匹配的问题列表;
将所述用户问题矩阵输入到所述双向长短期记忆神经网络模型,得到用户目标向量;
计算所述用户目标向量与所述问题列表中每个目标向量的相似度,并将相似度最高的目标向量对应的问题答案确定为用户所需答案。
2.根据权利要求1所述的智能自动问答方法,其特征在于,所述对所有自动问答数据中的问题文本进行切词与向量转化处理,使每一个所述问题文本均转化成一个问题矩阵,具体包括:
构建词向量模型库;
将所有自动问答数据中的每个问题文本进行切词处理,得到多个词;
将每个所述问题文本中的每个词与所述词向量模型库中的词进行匹配,若所述问题文本中的词与所述词向量模型库中的词匹配成功,则保留与所述词向量模型库中的词匹配成功的词,若所述问题文本中的词与所述词向量模型库中的词匹配不成功,则将与所述词向量模型库中的词匹配不成功的词替换为0;
将每个问题文本中存在的每个0和保留下的每个词均转化为一个长度为300的向量;
将所有所述向量组合,得到每个问题文本对应的问题矩阵;所述问题矩阵为n*300;n表示所有所述问题文本中字数最长的字数。
3.根据权利要求2所述的智能自动问答方法,其特征在于,所述将每个问题文本中存在的每个0和保留下的每个词均转化为一个长度为300的向量,具体包括:
采用开源词向量模型chinese-word-vectors,将每个问题文本中存在的每个0和保留下的每个词均转化为一个长度为300的向量。
4.根据权利要求2所述的智能自动问答方法,其特征在于,在将每个所述问题文本中的每个词与所述词向量模型库中的词进行匹配之前,还包括:
将所有所述问题文本中字数最长的字数n设置为问题文本统一处理长度;
提取问题文本字数低于n的问题文本,并将字数低于字数n的问题文本用0补齐,使每个问题文本的字数均为n。
5.根据权利要求2所述的智能自动问答方法,其特征在于,所述构建双向长短期记忆神经网络模型,具体包括:
采用TensorFlow第三方库进行双向长短期记忆神经网络搭建;
确定模型参数和调用函数;
根据所述模型参数、所述调用函数、所述双向长短期记忆神经网络,构建双向长短期记忆神经网络模型;所述双向长短期记忆神经网络模型的输入为n*300的矩阵;所述双向长短期记忆神经网络模型的输出为一个17维的向量。
6.根据权利要求1所述的智能自动问答方法,其特征在于,所述计算所述用户目标向量与所述问题列表中每个目标向量的相似度,并将相似度最高的目标向量对应的问题答案确定为用户所需答案,具体包括:
采用余弦相似函数,计算所述用户目标向量与所述问题列表中每个目标向量的相似度,并将相似度最高的目标向量对应的问题答案确定为用户所需答案。
7.根据权利要求6所述的智能自动问答方法,其特征在于,所述余弦相似函数为其中,S(s1,s2)表示相似度得分,s1表示所述用户目标向量,s2表示所述问题列表中的目标向量,T表示转置。
8.一种基于双向长短期记忆神经网络的智能自动问答系统,其特征在于,所述智能自动问答系统包括:
问题矩阵得到模块,用于对所有自动问答数据中的问题文本进行切词与向量转化处理,使每一个所述问题文本均转化成一个问题矩阵;
双向长短期记忆神经网络模型构建模块,用于构建双向长短期记忆神经网络模型;
目标向量存储模块,用于将所述问题矩阵依次输入到所述双向长短期记忆神经网络模型中,所述双向长短期记忆神经网络模型依次输出所述问题矩阵对应的目标向量,并将所有所述目标向量存储到智能自动问答数据库中;所述智能自动问答数据库包括问题文本、问题文本对应的目标向量以及问题文本对应的问题答案;
用户输入问题文本获取模块,用于获取用户输入问题文本;
特征词和用户问题矩阵得到模块,用于对所述用户输入问题文本进行切词与向量转化处理,得到特征词和用户问题矩阵;
问题列表提取模块,用于从所述智能自动问答数据库中提取与所述特征词相匹配的问题列表;
用户目标向量得到模块,用于将所述用户问题矩阵输入到所述双向长短期记忆神经网络模型,得到用户目标向量;
用户所需答案确定模块,用于计算所述用户目标向量与所述问题列表中每个目标向量的相似度,并将相似度最高的目标向量对应的问题答案确定为用户所需答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811478881.2/1.html,转载请声明来源钻瓜专利网。