[发明专利]一种基于协同嵌入增强题目表示的知识追踪方法及系统有效
| 申请号: | 202110276011.2 | 申请日: | 2021-03-15 |
| 公开(公告)号: | CN112949929B | 公开(公告)日: | 2022-06-07 |
| 发明(设计)人: | 孙建文;刘三女牙;周建鹏;张凯 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/20;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 雷霄 |
| 地址: | 430079 *** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 协同 嵌入 增强 题目 表示 知识 追踪 方法 系统 | ||
本发明公开了一种基于协同嵌入增强题目表示的知识追踪方法及系统。该方法包括步骤:预训练、向量融合、更新知识状态和输出预测结果,其中在预训练时,根据学生历史答题数据集构建学生与题目二部图和题目与技能二部图,来捕捉题目之间的协同信号,然后采用node2vec算法将协同信号中蕴含的题目相似性编码到题目嵌入中。本发明可以解决“技能层次模型问题”和稀疏问题等导致的信息不足问题,提升知识追踪的预测性能,并且数据越稀疏,相比现有技术的优势越明显。
技术领域
本发明属于知识追踪技术领域,更具体地,涉及一种基于协同嵌入增强题目表示的知识追踪方法及系统。
背景技术
知识追踪(Knowledge Tracing,KT)是智能导学系统(Intelligent TutoringSystem,ITS)中的关键技术,它根据学生在系统中的历史交互数据追踪学生的知识状态(Knowledge State),从而预测学生未来的答题表现。具体而言,KT通过学生过去的答题序列,建模和更新学生对知识点的掌握情况,最后预测学生正确回答下一道题目的概率值。KT可以帮助我们更加深入地了解学生的学习过程和知识掌握情况,进而为学生提供个性化的学习辅导(例如跳过简单题、延迟困难题),提升学生的学习效率和学习体验。
经典的KT模型主要有两类:基于概率的模型(Probability-Based Models)和基于深度学习的模型(Deep Learning-Based Model)。基于概率的模型以贝叶斯知识追踪(Bayesian Knowledge Tracing,BKT)为代表。BKT基于隐马尔可夫模型(Hidden MarkovModel,HMM),它以题目对应的技能编号(skill id)作为输入,并为每个技能构建一个独立的模型。BKT将知识状态定义为HMM中的隐变量,取值分为“掌握”和“不掌握”两种状态,并使用贝叶斯公式更新知识状态。但是BKT存在两个问题:一方面,它为每个技能构建独立的模型,无法捕捉技能之间的联系;另一方面,它对知识状态进行二值化,过度简化了真实状态的复杂性。
后来研究者提出将深度学习应用到知识追踪领域,提出基于深度学习的KT模型。大多数基于深度学习的KT模型都是以题目对应的技能编号作为模型的输入,并且预测每个技能对应的正确答题概率,而不是以题目编号(question id)作为输入进而预测每个题目对应的正确答题概率。这些模型被称为“技能层次模型(skill-level model)”。以DKT(DeepKnowledge Tracing,DKT)为例,DKT使用循环神经网络(Recurrent Neural Network,RNN)建模学生的答题序列,它将技能编号和答题正确性(correctness)统一编码为独热向量,作为后续模块的输入,但是无需为每一个技能单独建模。
目前大多数基于深度学习的KT模型存在“技能层次模型问题(skill-level modelproblem)”,即这些模型只使用技能编号表示题目会使得模型无法区分相同技能的两道题目,进而降低模型的预测性能。为了区分不同的题目,一个简单的解决方法是将这些模型中的技能编号替换为题目编号。然而因为题目数量很大,每个学生只回答其中的小部分,所以很多题目被回答的次数很少,导致学生和题目的交互数据很稀疏,即会导致稀疏问题,使得模型的预测性能在有些数据集上变得更差。
现有专利CN202011071060提出了一种融合问题模式和答题结果的双卷积知识追踪方法及系统,其考虑题目和答题结果属于不同类型的数据,因此通过两个卷积神经网络分别从题目相关数据和答题结果相关数据中提取特征,使得模型可以充分考虑每道题目的特征,从而提升模型预测性能。其同时使用题目编号和技能编号作为输入,可以避免“技能层次模型问题”;但是其并没有从数据中充分挖掘题目之间的相似性来补充额外信息,因此仍然存在上述的数据稀疏问题。
发明内容
针对现有技术的至少一个缺陷或改进需求,本发明提供了一种基于协同嵌入增强题目表示的知识追踪方法及系统,使用题目之间的协同信息作为补充来增强题目的表示,缓解数据稀疏问题,进而提高知识追踪模型的预测性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110276011.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





