[发明专利]一种论文自检方法及系统有效
申请号: | 201610021493.6 | 申请日: | 2016-01-13 |
公开(公告)号: | CN105677641B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 夏峰 | 申请(专利权)人: | 夏峰 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京冠和权律师事务所11399 | 代理人: | 朱健,陈国军 |
地址: | 410000 湖南省长沙市芙蓉区荷*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 论文 自检 方法 系统 | ||
技术领域
本发明属于文本检测领域,尤其涉及一种论文自检方法及系统。
背景技术
论文抄袭检测是指判断某一篇论文是否涉嫌抄袭其他一篇或多篇文档的文本内容。但由于抄袭并不完全等同于复制,而是有可能通过一定的语义变换、同义词替换或翻译外文文档等多种手段来涉嫌抄袭其他文档的文本内容。
目前,论文抄袭检测技术主要有两种方法:一种是通过指纹识别检测法,一种是通过基于文本里段落词频统计检测法。所谓指纹识别是指从提交的原文文本内容中提取一些称为指纹的数据特征串,根据指纹的相同率来判断某一篇文档是否对其他文档进行了抄袭。所谓段落词频统计检测法是指对提交的文本进行分词,通过统计文本中各个段落的出现频率,设定一个阈值后将待查文本的每个数组与查询文本的每个数组进行比较,最后依据此指标来判断是否进行了抄袭。现有技术中的上述方法存在一定程度的识别率率低、效率不高等问题。
发明内容
为克服上述现有技术的不足,本发明提供了一种论文自检方法及系统。
本发明提供了一种论文自检方法及系统。用户写作风格相似度计算模块用于计算当前用户写作风格相似度,用户写作风格相似度判断模块将当前用户写作风格相似度SimT(USER)与系统预设的自我审核门限进行比较;当用户写作风格相似度SimT(USER)高于所述自我审核门限时,即可认为当前用户提交的待审核文档与用户写作风格不一致;当用户写作风格相似度SimT(USER)低于所述自我审核门限时,即可认为当前用户提交的待审核文档与用户写作风格一致。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
图1示出了根据本发明的一个实施例的论文自检系统的框图;
图2示出了根据本发明的一个实施例的滑动窗口检测法。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的系统及方法具体实施方式、特征及其功效,详细说明如后。在下述说明中,不同的“一实施方式”或“实施方式”指的不一定是同一实施方式。此外,一或多个实施方式中的特定特征、结构、或特点可由任何合适形式组合。
如图1所示,本发明的论文自检系统(下称系统)中包含素材子系统;用户子系统;疑似素材提取子系统;对比子系统,其中所述素材子系统,用于准备供抄袭检测对比使用的素材;用户子系统,用户管理用户登录信息,以及确定用户写作风格;疑似素材提取子系统,用于从对比库中提取与待鉴定文档的疑似素材;对比子系统,用于将疑似素材与待鉴定文档进行对比,生成对比报告。
根据本发明的一个具体实施方式,素材子系统可以进一步包括:对比库;分词库,分词库中包含同义近义词库以及中外文同义词库;分词模块;分词组模块;中外文分词组模块;分词词性分类模块;分词组词性分类模块;中外文分词组词性分类模块;分词特征值生成模块;分词组特征值生成模块;中外文分词组特征值生成模块;分词紧密系数生成模块;分词组紧密系数生成模块;中外文分词组紧密系数生成模块;分词紧密系数特征向量生成模块;分词组紧密系数特征向量生成模块;中外文分词组紧密系数特征向量生成模块;分词自由向量维数确定模块;分词组自由向量维数确定模块;中外文分词组自由向量维数确定模块;分词精简向量维数生成模块;分词组精简向量维数生成模块;中外文分词组精简向量维数生成模块;分词特征向量生成模块;分词组特征向量生成模块;以及中外文分词组特征向量生成模块中的一个或多个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏峰,未经夏峰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610021493.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卫生间排水盖板条
- 下一篇:生态排水沟