[发明专利]一种代码抄写行为识别方法、装置和系统有效
申请号: | 201710867292.2 | 申请日: | 2017-09-22 |
公开(公告)号: | CN107679567B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 方宏;方达 | 申请(专利权)人: | 江苏海事职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F11/34 |
代理公司: | 江苏银创律师事务所 32242 | 代理人: | 孙计良 |
地址: | 211170 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 代码 抄写 行为 识别 方法 装置 系统 | ||
本发明公开了一种代码抄写行为识别方法、装置和系统。其中系统包括编辑端装置和客户端装置。编辑端装置包括UI模块、行为记录模块以及作业电子包生成模块。行为记录模块用于提取所述UI模块中学生编辑代码的键盘和鼠标的输入输出记录生成编辑行为记录。作业电子包生成模块用于将作业代码集和编辑行为记录打包成作业电子包。识别端装置包括作业输入模块、相似分析模块、分类学习模块以及抄写识别模块。识别端装置通过分析学生代码相似度找出相似学生集,然后根据相似学生的编辑行为记录采用机器学习算法进行分析得到该相似学生是否抄写行为。
技术领域
本发明涉及学生程序作业的自动化批改。
背景技术
在学生编程作业及编程考试中,同学之间互相抄袭、甚至替人写代码的现象时有发生,人工发现抄袭的代码,需要逐个比对每份提交的代码,费时费力;通过代码查重软件对提交的源代码文本进行相似度检查来判断是否存在抄袭,是目前应用较多的方法;但对于编程初学者,很多题目使用同一种算法,代码量也不多,代码相似度普遍较高,影响了抄袭判断的准确度;而且该方法难以判断谁是抄袭者。
发明内容
本发明所要解决的问题:判断学生编程作业中是否存在抄袭。
为解决上述问题,本发明采用的方案如下:
根据本发明的一种代码抄写行为识别方法,包括如下步骤:
S1:获取各个学生的作业电子包;所述作业电子包内包含有作业代码集和编辑行为记录;所述编辑行为记录为学生在终端编辑代码时所获得键盘和鼠标的输入输出记录;
S2:计算各个学生的作业电子包内的作业代码集与其他学生的作业电子包内的作业代码集的相似度值,选取所述相似度值超过限值的学生作为该学生的相似学生,从而得到各个学生的所对应的相似学生集合;
S3:采用分类学习算法,对各个学生的所对应的相似学生集合内的相似学生的编辑行为记录与该学生的编辑行为记录进行分析判断该相似学生是否抄写。
进一步,根据本发明的代码抄写行为识别方法,所述分类学习算法为随机森林算法。
根据本发明的一种代码抄写行为识别装置,该装置包括以下模块:
M1,用于:获取各个学生的作业电子包;所述作业电子包内包含有作业代码集和编辑行为记录;所述编辑行为记录为学生在终端编辑代码时所获得键盘和鼠标的输入输出记录;
M2,用于:计算各个学生的作业电子包内的作业代码集与其他学生的作业电子包内的作业代码集的相似度值,选取所述相似度值超过限值的学生作为该学生的相似学生,从而得到各个学生的所对应的相似学生集合;
M3,用于:采用分类学习算法,对各个学生的所对应的相似学生集合内的相似学生的编辑行为记录与该学生的编辑行为记录进行分析判断该相似学生是否抄写。
进一步,根据本发明的代码抄写行为识别装置,所述分类学习算法为随机森林算法。
根据本发明的一种代码抄写行为识别系统,该系统包括编辑端装置和识别端装置;
所述编辑端装置包括UI模块、行为记录模块以及作业电子包生成模块;所述UI模块用于为学生编辑代码提供UI交互;所述行为记录模块用于提取所述UI模块中学生编辑代码的键盘和鼠标的输入输出记录生成编辑行为记录;所述作业电子包生成模块用于将学生编辑代码所生成的作业代码集和所述行为记录模块所生成的编辑行为记录打包成作业电子包;所述作业电子包内包含有作业代码集和编辑行为记录;
所述识别端装置包括作业输入模块、相似分析模块、分类学习模块以及抄写识别模块;
所述作业输入模块用于获取各个学生的作业电子包;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏海事职业技术学院,未经江苏海事职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710867292.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种达罗鲁胺的晶型制备方法
- 下一篇:带有过滤器元件的吸尘器