[发明专利]人机结合的中文作文批改系统和方法有效
申请号: | 202110774531.6 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113360608B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 杨林;雷思东 | 申请(专利权)人: | 北京阅神智能科技有限公司;北京一笔两划科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/117;G06F40/166;G06F40/216;G06F40/258;G06F40/289;G06F40/30 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 周亮 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机 结合 中文 作文 批改 系统 方法 | ||
1.一种人机结合的中文作文批改系统,其特征在于,包括:
作文获取系统,用于获取用户上传的图片格式的待批改作文;其中,所述的图片格式包括PDF格式;
预处理系统,用于利用ocr识别引擎,对获取的待批改作文进行版面分析以提取实际作文区域,得到文本位置坐标信息和文本内容信息,并进行标题提取和分段处理;
批改系统,用于对预处理系统得到的文本内容信息进行批改,并将批改信息添加至原始的图片格式的待批改作文的对应位置;其中,所述批改信息为可编辑形式,且所述批改系统提供批改工具,以使用户能够对所述批改信息进行修改;
素材推荐系统,用于根据作文存在的缺点自动推荐优秀作文素材。
2.根据权利要求1所述的系统,其特征在于,所述作文获取系统能够获取单张图片或获取批量上传的多张图片,若为批量上传的多张图片,则自动将多张图片与对应的姓名进行匹配;匹配过程包括:对各图片进行版面分析,以提取姓名区域得到多张姓名区域图片,利用ocr识别引擎对各所述姓名区域图片进行识别,得到姓名信息;根据得到的姓名信息将对应的图片与对应的姓名进行匹配。
3.根据权利要求1所述的系统,其特征在于,所述预处理系统提取实际作文区域的过程包括:
提取图片外围最大连通区域,并在超过设定区域阈值时,确定连通区域内部的区域为实际作文区域;
对最大连通区域轮廓上的每个点与上传图片四个顶点进行距离计算,分别选取距离原始图片四个顶点距离最近的四个点作为实际作文区域的四个顶点;
基于上述选取得到的实际作文区域的四个顶点,进行透视变换,以矫正图片。
4.根据权利要求3所述的系统,其特征在于,所述预处理系统进行标题提取和分段处理的过程包括:
将矫正后的图片输入ocr识别引擎,针对返回的所述文本位置坐标信息中的行坐标信息进行标题提取和分段处理;其中,若一页纸中最开始的连续的两行最左顶点位置的横坐标都大于下一行,且大于预设的第一阈值,则确定第一行为标题区域;若当前行最左侧顶点位置的横坐标大于下一行,且大于预设的第二阈值,则认为当前行为新的一段的开始。
5.根据权利要求1所述的系统,其特征在于,所述中文作文批改系统设置有预先训练的作文体裁分类模型和评语库,其中,所述作文体裁分类模型是基于深度学习算法训练得到的;
所述批改系统进行批改的过程中,利用所述作文体裁分类模型,基于所述文本内容信息识别作文体裁,并根据识别出的作文体裁自动从所述评语库中选择相关评语进行推送,以便用户进行选择和修改。
6.根据权利要求5所述的系统,其特征在于,所述批改系统中在批改过程中,根据预先设置的多个待检测的能力点,确定作文内容信息中未出现的能力点;其中,每种作文体裁对应设置有多个能力点;
所述素材推荐系统根据作文内容信息中未出现的能力点,自动推荐对应的优秀作文素材。
7.根据权利要求1所述的系统,其特征在于,所述批改信息包括文字评语信息和标记,所述标记包括线条、图形和符号;
所述批改系统在将批改信息添加至原始的图片格式的待批改作文的对应位置时,根据用户习惯,针对不同的文本内容信息将不同形式的标记添加至图片中的对应位置,并添加文字评语信息。
8.根据权利要求1所述的系统,其特征在于,还包括总评系统,用于根据各批改信息对作文进行整体评价,包括针对作文的不同方面进行打分并给出总分和总评建议,以及对作文的字数、词语和句子进行统计。
9.一种人机结合的中文作文批改方法,其特征在于,应用于如权利要求1-8任一项所述的人机结合的中文作文批改系统,所述方法包括:
所述作文获取系统获取用户上传的图片格式的待批改作文;
所述预处理系统利用ocr识别引擎,对获取的待批改作文进行版面分析以提取实际作文区域,得到文本位置坐标信息和文本内容信息,并进行标题提取和分段处理;
所述批改系统对预处理系统得到的文本内容信息进行批改,并将批改信息添加至原始的图片格式的待批改作文的对应位置;
所述素材推荐系统根据作文存在的缺点自动推荐优秀作文素材。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京阅神智能科技有限公司;北京一笔两划科技有限公司,未经北京阅神智能科技有限公司;北京一笔两划科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110774531.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调式医用雾化器
- 下一篇:动力输出装置PTO离合器的控制方法及装置