[发明专利]基于数字化编码的题型识别方法及其系统有效
申请号: | 201911012203.1 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110765107B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 张新华;王朝选;魏鹏;刘严 | 申请(专利权)人: | 浙江蓝鸽科技有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06Q50/20 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 314000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数字化 编码 题型 识别 方法 及其 系统 | ||
本发明涉及教育领域,公开了一种基于数字化编码的题型识别方法及其系统,该方法将试题的题型特征进行数字化编码,生成该试题的题型编码;将待识别试题的题型编码与样题题型编码进行匹配,实现题型识别。本发明通过制定统一的编码标准,有利于数据统一处理,且数据处理简单,题型识别速度快;本发明不限于试题格式多样化、复杂化,满足所有试题题型的识别,且识别准确率高。
技术领域
本发明属于教育领域,尤其涉及一种基于数字化编码的题型识别方法及其系统。
背景技术
在智能化题库的构建中,对试题的题型进行标识是最基础的环节,有利于后续智能化产品中的试题精准化推荐。然而,海量的试题资源,涉及到丰富的题型类型,若人工对其题型一一进行标识,将会耗费大量的人力和物力。而已有的一些题型识别技术,存在着题型识别类型单一、识别准确率低等问题。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于数字化编码的题型识别方法及其系统,能够快速、准确地对试题题型进行识别与分类。
本发明的目的是通过以下技术方案来实现的:本发明采用数字化编码的方式,将试题的题型特征转化成编码的形式,并通过与样题的题型编码进行匹配,识别出试题的题型。具体地:
本发明公开了一种基于数字化编码的题型识别方法,该方法包括:
将试题的题型特征进行数字化编码,生成该试题的题型编码;
将待识别试题的题型编码与样题题型编码进行匹配,实现题型识别。
进一步地,该题型编码是根据试题结构特征、以及各结构对应的内容表现特征生成的统一规范性编码。
进一步地,该结构特征的编码按照各结构在试题中出现的顺序有序表示;
各结构对应的内容表现特征的编码紧跟其对应的结构特征编码之后,且各类内容表现特征按顺序编码。
进一步地,收集各学科各题型的试题样题,生成样题题型编码,构建题型样题特征库,该题型样题特征库包括多个样题和样题属性信息,其中,样题属性信息包括所属学科、所属题型名称及其生成的题型编码。
进一步地,将试题的题型特征进行数字化编码之前还包括:对试题序号进行识别并标识;对试题导语进行识别并标识;并结合试题序号和导语的关系,将试卷中的试题进行分割,并对试题的结构进行标识。
进一步地,将待识别试题的题型编码与样题题型编码进行结构特征匹配:从样题题型编码集中筛选出与待识别试题的结构特征编码相同,且顺序一致的题型编码,根据筛选出的样题题型编码确定试题题型。
进一步地,在结构特征匹配前,基于该试题导语的题型范围筛选出该试题对应的题型范围,并获取对应题型的样题题型编码集。
进一步地,在结构特征匹配后,进行结构内容特征匹配,具体为:依次将待识别题型编码与筛选出的样题题型编码集的各编码进行结构内容特征编码匹配,匹配度由内容表现特征的相似程度确定;选择匹配度最高值Mmax与阈值M0比较:
若Mmax>M0,则匹配成功,输出匹配度最高的样题题型为该试题的题型;
若Mmax<M0,则匹配失败,将此待识别试题及其题型编码作为样题数据。
本发明还公开了一种基于数字化编码的题型识别系统,该系统包括编码模块和匹配模块;该编码模块用于将试题的题型特征进行数字化编码,生成该试题的题型编码;该匹配模块用于将待识别试题的题型编码与样题题型编码进行匹配,实现题型识别。
进一步地,该系统还包括预处理模块和构建模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江蓝鸽科技有限公司,未经浙江蓝鸽科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911012203.1/2.html,转载请声明来源钻瓜专利网。