[发明专利]试卷内容提取方法、试卷匹配方法、装置、设备以及介质在审
申请号: | 201910876239.8 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110674354A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 朱达华;徐宋传;陈晓宇 | 申请(专利权)人: | 广州光大教育软件科技股份有限公司 |
主分类号: | G06F16/83 | 分类号: | G06F16/83;G06Q50/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 文档内容 试题 试卷 段落数据 内容提取 文本内容 集合 计算机技术 对象添加 快速获取 内容集 遍历 匹配 | ||
本发明涉及计算机技术的技术领域,尤其是涉及试卷内容提取方法、试卷匹配方法、装置、设备以及介质,其试卷内容提取方法包括:S10:若获取到文档试题,则从所述文档试题中获取试题文档;S20:从所述试题文档中获取文档内容文件,其中,所述文档内容文件为xml格式的文件;S30:遍历所述文档内容文件,从所述文档内容文件中获取文档段落数据;S40:获取每一所述文档段落数据中的文本内容,将每一所述文档段落数据中的文本内容组成对应的段落对象;S50:将所述段落对象添加至集合plist中,并将所述集合plist作为试卷内容集。本发明具有快速获取试题文档内容,且能够从试题文档内容中获取具体试题的效果。
技术领域
本发明涉及计算机技术的技术领域,尤其是涉及试卷内容提取方法、试卷匹配方法、装置、设备以及介质。
背景技术
目前,在学校中,尤其是对于高中需要参加高考的学生,为了让学生能够接触到更多的题目,提升学生的学习成绩,学生会参加大量的考试或是做大量的试题。
在出题老师进行出题时,需要从大量的题库中或试卷中选取出对应的题目,进而组成新的试卷或练习卷。在制作题库的时候,通常是从现有的试题中,将试题中的题目进行拆分,进而将拆分出的题目作为题库。然而在对现有的文档的试卷进行拆分时,需要人工进行对试卷中进行标记,因而人工参与比较大,比较麻烦,也容易出错,因此还有改进空间。
发明内容
本发明的目的一是提供一种快速获取试题文档内容的试卷内容提取方法。
本发明的上述发明目的一是通过以下技术方案得以实现的:
一种试卷内容提取方法,所述试卷内容提取方法包括:
S10:若获取到文档试题,则从所述文档试题中获取试题文档;
S20:从所述试题文档中获取文档内容文件,其中,所述文档内容文件为xml格式的文件;
S30:遍历所述文档内容文件,从所述文档内容文件中获取文档段落数据;
S40:获取每一所述文档段落数据中的文本内容,将每一所述文档段落数据中的文本内容组成对应的段落对象;
S50:将所述段落对象添加至集合plist中,并将所述集合plist作为试卷内容集。
通过采用上述技术方案,从文档试题中的试题文档中,获取xml格式的文档内容文件,便于从该试题文档中读取到对应的文档段落的标签,进而能够从该文档段落标签中获取到对应的段落,以及每一段落中的文档段落数据,有利于从该文档段落数据中读取出每一文档段落数据中的段落对象;同时,将该段落独享添加至集合plist中,进而有助于能够通过plist的文件形式,存储预设的获取试题文档中的具体试题的规则,进而有助于在试题文档中自动获取得到具体试题,进而能够有助于对试题文档的识别和拆分。
本发明进一步设置为:步骤S20包括:
S21:从所述试题文档中获取文档格式;
S22:对所述文档格式的兼容性进行判断,若判断出所述文档格式不兼容,则将所述文档格式转换成兼容格式;
S23:从所述兼容格式中的所述试题文档中获取文档内容文件。
通过采用上述技术方案,通过对文档的兼容性进行判断,再将非兼容格式的试题文档进行格式转换后,能够保证在获取文档内容文件时的准确性,进而有助于后续对试题的提取与拆分。
本发明的目的二而是提供一种能够从试题文档内容中获取具体试题的试卷内容提取方法。
一种试卷匹配方法,所述试卷匹配方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州光大教育软件科技股份有限公司,未经广州光大教育软件科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910876239.8/2.html,转载请声明来源钻瓜专利网。