[发明专利]一种基于学习社区对话流的成绩预测方法有效
| 申请号: | 201711466799.3 | 申请日: | 2017-12-28 |
| 公开(公告)号: | CN108228779B | 公开(公告)日: | 2021-03-23 |
| 发明(设计)人: | 叶俊民;罗达雄;郭霄宇;陈曙;王志锋;金聪;徐松;赵丽娴;李蓉;杨艳 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06Q50/20 |
| 代理公司: | 武汉天力专利事务所 42208 | 代理人: | 吴晓颖 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 学习 社区 对话 成绩 预测 方法 | ||
1.一种基于学习社区对话流的成绩预测方法,其特征在于:该方法针对输入的课程下的学习小组的对话流文件,输出该小组中的学习者成绩等级,该方法分为训练和预测两个阶段,训练阶段得到成绩预测模型,预测阶段应用此模型进行成绩预测;
该方法包括以下步骤:
(1)训练阶段,将某课程的历史对话流文件及每个对话流文件对应学习小组的课程结业成绩等级作为训练阶段的输入数据,在此基础上,首先通过预处理得到标准对话流文件;其次通过对话流划分算法,生成词嵌入模型并得到对话流文本段文件;接着,通过对话状态矩阵生成算法,生成主题词表文件、学习小组的对话状态矩阵和成绩等级矩阵;最后通过预测模型生成算法,得到预测模型;
其中,所述对话流划分算法具体步骤如下:
第一步,遍历每一个标准对话流文件,将文件中标准对话的发言内容进行分词处理后作为一行写入词嵌入语料文件;
第二步,利用词嵌入语料文件训练CBOW模型;
第三步,依次处理每一个标准对话流文件;创建文本段ID及保存其对应对话链表的字典;依次遍历每一个标准对话,如果标准对话与当前ID对应对话链表中最后一个对话的时间差值小于T’,T’=2min,且标准对话的发言内容与当前ID对应对话链表的内容相似度大于S,S选用使得划分后的对话流文本段的文本段个数均值最接近前3个月教学大纲中的核心知识点数的相似度,将标准对话加入当前ID对应对话链表,否则,ID加1,将标准对话加入ID对应对话链表;计算字典中每个对话链表的发言内容长度和均值;将字典中发言内容长度和大于均值的对话链表中每个对话的发言内容拼接为一个文本段写入与其对应的对话流文本段文件;
按照如下公式计算标准对话与ID对应对话链表的内容相似度
DiaSim=MAX(Sim(Dia,Diai)),Diai∈Block_Map[ID]
其中,Dia为每次读取的标准对话,Diai为字典中ID对应对话链表中的对话;
按照如下公式计算每两个标准对话的内容相似度
其中,Word_List函数表述对话发言内容切分后的词链表,Wi、Wj分别是Dia1和Dia2中的词,n为Dia1发言内容切分词链表的长度,公式在计算时保证Dia1发言内容切分词链表的长度小于Dia2发言内容切分词链表的长度,MAX函数在计算时使用CBOW模型中Wi、Wj所对应向量,计算其余弦相似度,最大值累加到Sim;
(2)预测阶段,将该课程的对话流文件作为输入,利用训练阶段得到的多个模型和文件,通过采用与训练过程相同的处理步骤,即预处理、对话流划分算法、对话状态矩阵生成算法,最后应用训练阶段生成的成绩预测模型得到成绩等级。
2.根据权利要求1所述的基于学习社区对话流的成绩预测方法,其特征在于:所述预处理方法的输入为对话流文件,该文件中的一个对话包含两行内容:第一行为对话的时间戳和发言人;第二行为对话内容;
预处理方法具体步骤如下:
第一步,提取对话中的时间戳、发言人和发言内容,生成形如格式“TS时间TS发言人TECS发言内容CE”形式的对话;
第二步,合并对话之间时间差值小于阈值T,T=2min,且发言人相同的对话的发言内容,以生成标准对话;
第三步,删除发言内容长度小于阈值L的标准对话,L=10字长,最终获取标准对话流文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711466799.3/1.html,转载请声明来源钻瓜专利网。





