[发明专利]人机结合的中文作文批改系统和方法有效

专利信息
申请号: 202110774531.6 申请日: 2021-07-08
公开(公告)号: CN113360608B 公开(公告)日: 2023-10-20
发明(设计)人: 杨林;雷思东 申请(专利权)人: 北京阅神智能科技有限公司;北京一笔两划科技有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/117;G06F40/166;G06F40/216;G06F40/258;G06F40/289;G06F40/30
代理公司: 北京细软智谷知识产权代理有限责任公司 11471 代理人: 周亮
地址: 100089 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 人机 结合 中文 作文 批改 系统 方法
【说明书】:

本申请涉及一种人机结合的中文作文批改系统和方法,所述系统包括作文获取系统、预处理系统、批改系统和素材推荐系统,其中,预处理系统对作文获取系统获取的图片格式的待批改作文进行预处理后,由批改系统进行自动批改,并在作文纸的原始图片上给出批改信息,从而教师和学生能够看到直观的批改结果;此外,给出的批改信息是可编辑形式的,从而教师能够根据自身经验对批改信息进行进一步修改,使批改结果更加符合实际情况;并且,素材推荐系统可以根据批改结果中作文的缺点自动推荐优秀的作文素材,便于学生提升作文能力。也就是说,采用本申请的技术方案,能够解决现有技术存在的问题,能够呈现直观的批改结果,且提供更多功能。

技术领域

本申请涉及计算机技术领域,尤其涉及一种人机结合的中文作文批改系统和方法。

背景技术

nlp(Natural Language Processing,自然语言处理)技术在语文作文等领域开始逐渐渗透,在一些作文基础维度诊断和统计分析类的工作上,都可以由计算机来分担一部分老师比较琐碎的工作。

现有的作文自动批改系统大多是需要两阶段的操作,首先需要进行ocr识别(Optical Character Recognition,光学字符识别),将上传的作文图片转换为文字形式的结果,然后再基于nlp技术对转换的文字内容进行识别、批改。其批改结果最终也是以单独的文本形式展示的,不能同步到作文纸上,也即批改结果呈现方式不太直观;并且现有的大多系统只是实现批改功能,功能单一。

发明内容

本申请提供一种人机结合的中文作文批改系统和方法,以解决现有的作文自动批改系统的批改结果呈现方式不太直观,且功能单一的问题。

本申请的上述目的是通过以下技术方案实现的:

第一方面,本申请实施例提供一种人机结合的中文作文批改系统,其包括:

作文获取系统,用于获取用户上传的图片格式的待批改作文;其中,所述的图片格式包括PDF格式;

预处理系统,用于利用ocr识别引擎,对获取的待批改作文进行版面分析以提取实际作文区域,得到文本位置坐标信息和文本内容信息,并进行标题提取和分段处理;

批改系统,用于对预处理系统得到的文本内容信息进行批改,并将批改信息添加至原始的图片格式的待批改作文的对应位置;其中,所述批改信息为可编辑形式,且所述批改系统提供批改工具,以使用户能够对所述批改信息进行修改;

素材推荐系统,用于根据作文存在的缺点自动推荐优秀作文素材。

可选的,所述作文获取系统能够获取单张图片或获取批量上传的多张图片,若为批量上传的多张图片,则自动将多张图片与对应的姓名进行匹配;匹配过程包括:对各图片进行版面分析,以提取姓名区域得到多张姓名区域图片,利用ocr识别引擎对各所述姓名区域图片进行识别,得到姓名信息;根据得到的姓名信息将对应的图片与对应的姓名进行匹配。

可选的,所述预处理系统提取实际作文区域的过程包括:

提取图片外围最大连通区域,并在超过设定区域阈值时,确定连通区域内部的区域为实际作文区域;

对最大连通区域轮廓上的每个点与上传图片四个顶点进行距离计算,分别选取距离原始图片四个顶点距离最近的四个点作为实际作文区域的四个顶点;

基于上述选取得到的实际作文区域的四个顶点,进行透视变换,以矫正图片。

可选的,所述预处理系统进行标题提取和分段处理的过程包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京阅神智能科技有限公司;北京一笔两划科技有限公司,未经北京阅神智能科技有限公司;北京一笔两划科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110774531.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top