[发明专利]基于数字化编码的题型识别方法及其系统有效
申请号: | 201911012203.1 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110765107B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 张新华;王朝选;魏鹏;刘严 | 申请(专利权)人: | 浙江蓝鸽科技有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06Q50/20 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 314000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数字化 编码 题型 识别 方法 及其 系统 | ||
1.一种基于数字化编码的题型识别方法,其特征在于,该方法包括:
对试题序号进行识别并标识;对试题导语进行识别并标识;并结合试题序号和导语的关系,将试卷中的试题进行分割,并对试题的结构进行标识;
将试题的题型特征进行数字化编码,生成该试题的题型编码;所述题型编码是根据试题结构特征、以及各结构对应的内容表现特征生成的统一规范性编码;
将待识别试题的题型编码与样题题型编码进行匹配,实现题型识别,所述匹配包括结构特征匹配:从样题题型编码集中筛选出与待识别试题的结构特征编码相同,且顺序一致的题型编码,根据筛选出的样题题型编码确定试题题型;在结构特征匹配后,进行结构内容特征匹配,具体为:依次将待识别题型编码与筛选出的样题题型编码集的各编码进行结构内容特征编码匹配,匹配度由内容表现特征的相似程度确定;选择匹配度最高值Mmax与阈值M0比较:
若Mmax>M0,则匹配成功,输出匹配度最高的样题题型为该试题的题型;
若Mmax<M0,则匹配失败,将此待识别试题及其题型编码作为样题数据。
2.根据权利要求1所述的一种基于数字化编码的题型识别方法,其特征在于,所述结构特征的编码按照各结构在试题中出现的顺序有序表示;
所述各结构对应的内容表现特征的编码紧跟其对应的结构特征编码之后,且各类内容表现特征按顺序编码。
3.根据权利要求1所述的一种基于数字化编码的题型识别方法,其特征在于,收集各学科各题型的试题样题,生成样题题型编码,构建题型样题特征库,所述题型样题特征库包括多个样题和样题属性信息,其中,所述样题属性信息包括所属学科、所属题型名称及其生成的题型编码。
4.根据权利要求1所述的一种基于数字化编码的题型识别方法,其特征在于,在结构特征匹配前,基于该试题导语的题型范围筛选出该试题对应的题型范围,并获取对应题型的样题题型编码集。
5.一种基于数字化编码的题型识别系统,其特征在于,包括编码模块和匹配模块;所述编码模块用于将试题的题型特征进行数字化编码,生成该试题的题型编码;所述匹配模块用于将待识别试题的题型编码与样题题型编码进行匹配,实现题型识别,所述匹配包括结构特征匹配:从样题题型编码集中筛选出与待识别试题的结构特征编码相同,且顺序一致的题型编码,根据筛选出的样题题型编码确定试题题型;在结构特征匹配后,进行结构内容特征匹配,具体为:依次将待识别题型编码与筛选出的样题题型编码集的各编码进行结构内容特征编码匹配,匹配度由内容表现特征的相似程度确定;选择匹配度最高值Mmax与阈值M0比较:
若Mmax>M0,则匹配成功,输出匹配度最高的样题题型为该试题的题型;
若Mmax<M0,则匹配失败,将此待识别试题及其题型编码作为样题数据;
该系统还包括预处理模块和构建模块;
所述预处理模块用于对试题序号进行识别并标识;对试题导语进行识别并标识;并结合试题序号和导语的关系,将试卷中的试题进行分割,并对试题的结构进行标识;
所述构建模块用于构建题型样题特征库,所述题型样题特征库包括多个样题和样题属性信息,其中,所述样题属性信息包括所属学科、所属题型名称及其生成的题型编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江蓝鸽科技有限公司,未经浙江蓝鸽科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911012203.1/1.html,转载请声明来源钻瓜专利网。