[发明专利]一种英语阅读word文档格式化导入方法及系统在审
申请号: | 201911095769.5 | 申请日: | 2019-11-11 |
公开(公告)号: | CN112783957A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 郭永福;苏德 | 申请(专利权)人: | 上海遴睿教育科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28;G06F40/186 |
代理公司: | 上海宏京知识产权代理事务所(普通合伙) 31297 | 代理人: | 崔巍 |
地址: | 200439 上海市宝山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 英语 阅读 word 文档 格式化 导入 方法 系统 | ||
1.一种英语阅读word文档格式化导入方法,其特征在于,所述方法包括以下步骤:
步骤1:网络服务端定义文档检测规则属性、文档基础结构、文档检测导入方法以及文档对象实体类,并按照文档题型要求定义文档模板;
步骤2:客户端参照文档模板进行word文档编辑,并将word文档上传到网络服务端;
步骤3:网络服务端获取word文档,将word文档序列化为对象,并提取word文档中的各节点数据元素,按照预先定义的文档检测规则属性、文档基础结构进行检测筛选后保存属性;记录word文档各节点数据元素的开始下标、结束下标,并通过预先定义的文档检测导入方法、文档对象实例类,创建word文档对象实体类,将属性一一赋值;
步骤4:将word文档各节点数据元素的开始下标、结束下标代入word文档实例化对象;
步骤5:根据word文档各节点数据元素的开始下标、结束下标读取文档对象的结构属性,循环遍历结构属性的子节点,判断子节点是否为段落对象,如果是,则将子节点强制转化为段落;
步骤6:判断word文档各节点数据元素对应的转换方法,执行相应的转换;
步骤7:提取word文档各节点数据元素的开始下标、结束下标,进行循环遍历,将节点内容转换成HTML页面代码;根据正则编写的标准格式化、过滤的方法,达到一个数据正确完整性,将页码代码赋值到文档对象实例类中;
步骤8:将赋值后的文档对象实例类进行数据持久操作,保存到数据库中,并反馈结果给客户端;
步骤9:客户端提取结构化数据进行渲染,实现在线阅读、答题、自动批阅功能。
2.根据权利要求1所述的英语阅读word文档格式化导入方法,其特征在于:所述文档模板是按照英语阅读题型要求进行文档模板定义,包括英语阅读题型的属性、题干、答案、解析。
3.根据权利要求1所述的英语阅读word文档格式化导入方法,其特征在于:所述客户端通过HTML、CSS、JS技术对结构化数据进行渲染,实现在线阅读、答题、自动批阅功能。
4.根据权利要求1所述的英语阅读word文档格式化导入方法,其特征在于:所述数据库为关系型数据库。
5.一种英语阅读word文档格式化导入系统,其特征在于,所述系统包括客户端、与客户端通信连接的网络服务端,所述客户端上设置有文档上传模块;所述网络服务端上设置有文档标识模块、文档读取模块、文档识别解析模块以及文档存储模块;
所述文档上传模块用于编辑word文档并上传;
所述文档标识模块用于根据word文档标识信息调用保存的方法进行文档标识;
所述文档读取模块用于根据文档标识信息进行word文档信息读取;
所述文档识别解析模块用于对word文档内容进行片区分解、内容解析、数据拼接操作,将word文档转化成格式化数据;
所述文档存储模块用于对格式化转化后的数据进行存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海遴睿教育科技有限公司,未经上海遴睿教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911095769.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据显示方法、装置及系统
- 下一篇:一种高频智能控制系统柜