[发明专利]一种基于慕课平台的智能答疑系统及方法在审
申请号: | 202110876292.5 | 申请日: | 2021-07-31 |
公开(公告)号: | CN113722454A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 李广明;张雪;余晨晖;岳晶莹;何文斌 | 申请(专利权)人: | 东莞理工学院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/951;G06F40/289;G06K9/62;G06N3/04;G06N3/08;G06N5/02;G09B7/02 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 523808 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 平台 智能 答疑 系统 方法 | ||
1.一种基于慕课平台的智能答疑系统,其特征在于,包括用户端、问句分析模块、信息检索模块、知识库、相似度判断模块和爬虫模块;其中:
用户端用于提出问题并发送到问句分析模块中,并接收信息检索模块或爬虫模块反馈的答案;
问句分析模块用于对问题进行分析,确定问句所属类别;
信息检索模块根据问句所属类别对句子进行相似度计算,根据相似度计算结果对句子进行词语相似度匹配,从知识库中确定候选集;当句子相似度满足条件时,则根据候选集向用户端反馈答案;否则,则由爬虫模块反馈答案;
相似度判断模块用于判断问句的相似度是否满足条件;
爬虫模块用于通过网络爬虫爬取问题答案,并将相关问题存储到知识库中。
2.根据权利要求1所述的一种基于慕课平台的智能答疑系统,其特征在于,在所述问句分析模块中,对问句进行数据清洗、分词和去停用词处理并采用LSTM-CRF神经网络算法对句子进行词性标注。
3.根据权利要求2所述的一种基于慕课平台的智能答疑系统,其特征在于,在信息检索模块中,采用余弦相似度计算方法计算知识库中相似问题的答案,获取相似度值发送至相似度判断模块;若句子相似度满足条件,则从知识库中确定候选集,并根据候选集向用户端反馈答案。
4.根据权利要求2或3所述的一种基于慕课平台的智能答疑系统,其特征在于,还包括预训练模块;所述预训练模块采用Pos-Bert神经网络算法对词性标记后的句子数据进行训练,并将训练结果传输至所述信息检索模块。
5.一种基于慕课平台的智能答疑方法,其特征在于,包括以下步骤:
S1:构建知识库;
S2:获取问题数据,对知识库数据和问题数据进行数据清洗、分词和去停用词处理并采用LSTM-CRF神经网络模型进行词性标注;
S3:构建Pos-Bert神经网络模型对词性标注后的数据进行训练;
S4:将训练完的数据采用余弦相似度计算方法进行相似度计算,若句子相似度满足条件,则从知识库中确定候选集;否则,执行步骤S5;
S5:根据问题数据进行网络爬虫操作爬取问题答案并存储到知识库中;
S6:从步骤S4中的候选集中输出问题数据答案或从步骤S5中输出问题答案;
S7:根据步骤S1-S6,搭建基于edx平台的答疑系统,实现一种基于慕课平台的智能答疑系统。
6.根据权利要求5所述的一种基于慕课平台的智能答疑方法,其特征在于,在所述步骤S2中,所述LSTM-CRF神经网络模型的训练过程具体为:
S21:下载一个词性标注数据集,对数据集进行整理,构造词性标注数据集Pos_data;
S22:将数据集Pos_data划分为训练数据集train_Pos_data和测试数据集test_Pos_data;
S23:使用word2vec模型对训练数据集train_Pos_data进行词向量训练,训练后的词向量为Embed;
S24:构建的初步的LSTM模型,将Embed输入到LSTM模型中,得到le;
S25:定义crf为CRF模型实体,输入le进行预测得到outputs;
S26:定义词向量ID为x,outputs和x输入Model中进行训练,则得到模型Pos_model;
S27:利用测试数据集test_Pos_data对模型Pos_model进行测试,获取测试成功的LSTM-CRF神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞理工学院,未经东莞理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110876292.5/1.html,转载请声明来源钻瓜专利网。