[发明专利]基于异构图学习融合学习参与状态的知识追踪方法在审
| 申请号: | 202111413641.6 | 申请日: | 2021-11-25 |
| 公开(公告)号: | CN113947262A | 公开(公告)日: | 2022-01-18 |
| 发明(设计)人: | 肖冰;蒋华;马君亮;何聚厚 | 申请(专利权)人: | 陕西师范大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/20;G06N3/04;G06N3/08 |
| 代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 构图 学习 融合 参与 状态 知识 追踪 方法 | ||
1.一种基于异构图学习融合学习参与状态的知识追踪方法,其特征在于由下述步骤组成:
(1)获取训练数据集
在公共数据集Assistment2009中选取答题数量大于3题的学生,分为测试集和训练集,训练集与测试集的比为4∶1,学生i的答题序列Xi为:
其中,为学生i在时刻t的回答问题,为学生i在时刻t回答问题的知识点,为学生i在时刻t回答问题的正确与否,t∈[4,200];
(2)构建问题知识点二部图
问题知识点二部图G的结构如下:
问题知识点二部图G由知识点集合C{c1,c2,…,cγ}、问题集合Q{q1,q2,…qβ}、边集合R{r1,r2,…,rz}连接构成,知识点c1分别通过边r1、边r2、边r3与问题q1、q2、q3相连,知识点c2分别通过边r4、边r5与问题q3、q4相连,知识点cγ分别通过边rz-1、边rz与问题qβ-1、qβ,相连,β取值为5000~20000,γ取值为50~200,z取值为100~20000;
按下式构建问题知识点二部图G:
G=(Q,C,R)
其中,Q表示问题集合,C表示知识点集合,Q∪C构成二部图的顶点,R表示问题集合Q与知识点集合C连接的边集合;
(3)构建知识追踪模型
知识追踪模型由自适应异构图学习模块(1)、知识状态编码模块(2)、学习参与状态编码模块(3)、学生答题情况预测模块(4)构成,自适应异构图学习模块(1)的输出分别与知识状态编码模块(2)、学习参与状态模块(3)的输入相连,知识状态编码模块(2)、学习参与状态编码模块(3)的输出与学生答题情况预测模块(4)相连;
(4)生成问题张量和知识点张量
采用自适应异构图学习模块(1)生成问题张量和知识点张量,自适应异构图学习模块(1)由skip-gram网络构成,采用自适应随机游走方法将二部图G按式(2)转换为文本序列S:
S=F(G,l,P) (2)
l=2μ+2
P=(Q,C,Q),
其中F()表示定义在图上的随机游走函数,P表示在二部图G上进行随机游走的元路径,l为二部图G中每个顶点进行随机游走的长度,μ表示二部图G中平均每个问题相连的知识点的个数,|Q|、|C|分别表示问题集合Q、知识点集合C的势;将文本序列S输入skip-gram网络进行训练,滑动窗口大小设置为5,负采样个数为5,每个顶点的向量表示的维度为150,迭代次数为5次,训练时使用的线程数为24,得到张量Wg;将张量Wg按式(4)、(5)分别得到问题张量Wq、知识点张量Wc:
Wq=Wg[:|Q|] (4)
Wc=Wg[|Q|:] (5)
其中,[:]表示张量截取操作;
(5)编码学生知识状态
采用知识状态编码模块(2)对学生的知识状态进行编码,所述知识状态编码模块(2)由多头注意力机制网络构成,按式(6)编码生成学生知识状态xt:
其中,τ∈[1,t)表示该学生时间步t之前的答题记录,αt,τ表示时刻t所回答的问题与时刻τ回答问题的相关度,exp(·)表示指数函数ex,θ表示学生的遗忘速率,|t-τ|表示时刻t与时刻τ之间的时间间隔,vτ、kτ分别表示时刻τ注意力机制中的值向量、键向量,st表示时刻t注意力机制中的查询向量,kτ′表示时刻τ′注意力机制中的键向量,τ′∈[1,τ)表示该学生时间步τ之前的答题记录,Wv、Ws、Wk分别表示注意力机制中的值变换矩阵、查询变换矩阵、键变换矩阵,m、b、b′取值为有限正整数,[,]表示向量拼接操作,为时刻τ回答的知识点的向量,为时刻t回答问题的向量,为时刻τ′回答的知识点的向量,dm为向量st的维度,aτ表示时刻τ学生回答的向量,aτ′表示时刻τ′学生回答的向量;
(6)编码学生学习参与状态
采用学习参与状态编码模块(3)对学生的学习参与状态进行编码,所述学习参与状态编码模块(3)由全连接网络FC与多头注意力机制网络串联构成,编码学生学习参与状态et按式(7)进行:
v′τ=W′v×[lτ,pτ]
s′t=Ws′×[lt,pt]
k′τ=W′k×[lτ,pτ]
k′τ′=W′k×[lτ′,pτ′]
其中,τ∈[1,t)表示该学生时间步t之前的答题记录,α′t,τ表示时刻t答题时的参与状态与时刻τ答题时的参与状态的相关度,v′τ,k′τ分别表示时刻τ注意力机制中的值向量、键向量,s′t表示时刻t注意力机制中的查询向量,k′τ′表示时刻τ′注意力机制中的键向量,τ′∈[1,τ)表示该学生时间步τ之前的答题记录,W′v、Ws′、W′k分别表示注意力机制中的值变换矩阵、查询变换矩阵、键变换矩阵,de表示向量s′t的维度,[,]表示向量拼接操作,lτ、lt分别表示t时刻和τ时刻的参与状态的特征融合向量,lτ′表示τ′时刻的参与状态特征融合向量,FC为全连接网络,分别为时刻t、时刻τ回答的问题向量,表示τ′时刻回答的问题向量,ot表示t时刻参与状态的初始特征向量,oτ表示τ时刻参与状态的初始特征向量,oτ′表示τ′时刻参与状态的初始特征向量,pτ表示τ时刻位置嵌入向量,pτ′表示τ′时刻位置嵌入向量,pt表示t时刻位置嵌入向量;
(7)预测学生答题情况
采用学生答题情况预测模块(4)预测学生的答题情况,所述学生答题情况预测模块(4)由多层感知机σ构成,将步骤(5)、步骤(6)编码的知识状态xt和参与状态et输入多层感知机σ预测学生在t时刻的答题情况,预测值yt由下式确定:
yt=Wo×[xt,et]×w′o
其中,Wo为多层感知机σ的第一层权重矩阵,m′,n′取值为有限正整数,w′o为多层感知机σ的第二层权重矩阵,xt、et分别表示t时刻的知识状态和学习参与状态,[,]表示向量拼接操作;
(8)训练模型
按下式确定模型的损失函数L:
其中,n为数据集中学生的数量,n取值为有限的正整数,为模型的预测值,为学生在ε时刻的真实回答值;
使用训练集对知识追踪模型进行训练,自适应异构图学习模块(1)中skip-gram网络的滑动窗口大小设置为5,负采样个数为5,每个顶点的向量表示的维度为150,知识状态编码模块(2)中多头注意力机制的头个数为5,学习参与状态编码模块(3)中多头注意力机制的头个数为5,进行特征融合的全连接网络FC层数为1,神经元个数为100,学生答题情况预测模块(4)中的多层感知机的层数为1;训练时每次送入知识追踪模型数据量为64,知识追踪模型迭代次数为200,学习率为0.01;知识追踪模型通过对损失函数L进行反向传播,不断优化知识追踪模型中每个模块的权重参数,完成对知识追踪模型的训练;
(9)测试模型
将训练后的知识追踪模型在测试集上逐一预测每个学生在每个时刻的答题情况,直到预测完测试集上所有学生的答题情况,完成知识追踪模型的测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111413641.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





