[发明专利]一种基于题意文本的同知识点试题分组系统和方法有效

专利信息
申请号: 202011083837.9 申请日: 2020-10-12
公开(公告)号: CN112256869B 公开(公告)日: 2022-05-03
发明(设计)人: 陈建海;杨楠;沈睿;何钦铭;荣大中 申请(专利权)人: 浙江大学
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 郑海峰
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 题意 文本 知识点 试题 分组 系统 方法
【权利要求书】:

1.一种基于题意文本的同知识点试题分组系统,其特征在于,包括:

题目获取模块,其用于获取教学平台后台的题目数据,并以语种和知识点划分题目,每道题目至少包括编号和题干信息;

题目预处理模块,其用于针对同一知识点下的相同语种题目进行预处理,包括:获取同一知识点下相同语种题目的题干文本,并对获取的题干文本数据进行清洗,剔除题干文本重复的题目和题干文本缺失的题目;然后将题干文本分为若干个词汇,筛除停用词,得到各个题目的词汇集,所有题目的词汇集构成该知识点下的当前词汇表;

标签化模块,其用于对部分题目打上相应的标签;所述的部分题目是根据当前词汇表中的词汇随机筛选得到的,所筛选的题目至少覆盖80%词汇表;

多功能分组模块,其包括全自动分组的WSD-LDA子模块和带有用户偏好的半自动分组的独热随机森林子模块;

所述的WSD-LDA子模块不考虑题目标签,其首先进行词嵌入并获取题目的句向量,将句向量预先分为小类,再将小类中的词汇合并,继续分为大类,生成分组结果;所述的WSD-LDA子模块中设置有WSD-LDA模型,所述的WSD-LDA模型包括词嵌入、DBSCAN聚类网络、拼接层和LDA聚类网络;

首先通过词嵌入将每一个题目对应的词汇集中的词汇wi转化为词向量统计该词汇wi在整个知识点下的频度p(wi),根据频度确定题目的句向量以及题目句向量之间的余弦距离,其中n表示该题目含有的总词汇数,a为超参数;

然后通过DBSCAN聚类网络对余弦距离进行以最小包含点数为1的标准进行基于半径r的DBSCAN密度聚类,将题目预分为m个小类,其中第i个小类中包含了ki个题目,每个题目平均含有ni个词语;

再通过拼接层将每个小类包含的ki个题目对应的词汇集进行合并,保留重复词汇;

最后通过LDA聚类网络对m个长度为ki×ni的语料进行再聚类,根据LDA主题模型的困惑度自动调整聚类数目为M,最终将题目再分为M个大类,其中第j个大类下有mj个小类,且

所述的独热随机森林子模块考虑题目标签,其首先将所有的题目进行独热编码,获得题目独热向量;然后采用带标签的题目独热向量训练独热随机森林模型;再利用训练好的独热随机森林模型对不带标签的题目独热向量进行分类,生成分组结果;所述的独热随机森林子模块中设置有独热随机森林模型,所述的独热随机森林模型包括独热编码层和随机森林网络;

首先通过独热编码层对题目词汇表中每一个词汇进行独热编码,再对题目进行独热编码,所述的对题目进行独热编码为其所含词汇的独热编码向量之和,并进行0-1化处理,将题目向量中所有非0位置为1,得到带标签的题目独热向量和不带标签的题目独热向量;

然后采用带标签的题目独热向量对随机森林网络进行训练,得到训练好的独热随机森林模型;将不带标签的题目独热向量输入到训练好的独热随机森林模型中,得到不带标签的题目的分组结果;

分组存储模块,其用于读取多功能分组模块生成的分组结果,将题库中的题目按照分组结果进行分组存储;

分组更新模块,其用于根据教学平台题库的更新,实现分组结果的自动更新。

2.根据权利要求1所述的一种基于题意文本的同知识点试题分组系统,其特征在于,所述的分组更新模块,当对WSD-LDA子模块的题目分组结果进行更新时,将新加入的题目与同一知识点下相同语种题目共同作为待分组题目,经题目预处理模块处理后,通过WSD-LDA子模块重新分组,更新分组结果。

3.根据权利要求1所述的一种基于题意文本的同知识点试题分组系统,其特征在于,所述的分组更新模块,当对独热随机森林子模块的题目分组结果进行更新时,获取新题目的独热向量,直接利用训练好的独热随机森林子模块确定新题目的类型,将新题目纳入到分组结果中,更新分组结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011083837.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top