[发明专利]为题目打标签的方法、装置、存储介质及电子设备在审
申请号: | 201911301442.9 | 申请日: | 2019-12-17 |
公开(公告)号: | CN112989760A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张弦;程辉;邢德阳;董平 | 申请(专利权)人: | 北京一起教育信息咨询有限责任公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/258;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王洋 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 题目 标签 方法 装置 存储 介质 电子设备 | ||
本发明实施例提供了一种为题目打标签的方法、装置、存储介质及电子设备,该方法首先确定待打标签的题目的类型信息,然后基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,其中,所述类型信息至少包括口算类以及应用类。可见,本方案提供了一种基于题目的类型信息,自动为题目打标签的方式,避免了手动打标签导致的打标签效率低、成本高的问题。
技术领域
本发明涉及文档分类技术领域,具体涉及一种为题目打标签的方法、装置、存储介质及电子设备。
背景技术
通常通过为题目打标签,进而将多个题目进行分类,例如,该标签可以具体为题型、难度、知识点等,最终实现了题目与某种维度的关联。目前,为题目打标签是通过人工的方式进行,该方式的正确率较高,但效率较低,需要花费大量的时间及人力成本。
因此,如何一种为题目打标签的方法,既能保证正确率,又能提高效率,降低成本,是本领域技术人员亟待解决的一大技术难题。
发明内容
有鉴于此,本发明实施例提供了一种为题目打标签的方法,既能保证正确率,又能提高效率,降低成本。
为实现上述目的,本发明实施例提供如下技术方案:
一种为题目打标签的方法,包括:
确定待打标签的题目的类型信息,所述类型信息至少包括口算类以及应用类;
基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签。
可选的,当所述待打标签的题目的类型信息为所述口算类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:
获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、答案;
基于所述目标文字信息,确定出目标算数表达式;
基于上下文无关文算法,对所述目标算数表达式进行解析,得到目标四元组;
基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签。
可选的,所述基于所述目标文字信息,确定出目标算数表达式,包括:
基于正则表达式,对所述目标文字信息进行数据清洗,得到去噪文字信息;
对所述去噪文字信息进行信息抽取,得到所述目标算数表达式。
可选的,所述基于所述目标四元组、所述目标算数表达式以及预设划分规则,确定出所述待打标签的题目的目标标签,包括:
获取所述目标四元组中的最大操作数;
获取所述目标算数表达式中的括号信息;
基于所述最大操作数以及所述括号信息,确定所述预设划分规则中符合所述最大操作数以及所述括号信息的标签为所述待打标签的题目的目标标签。
可选的,当所述待打标签的题目的类型信息为所述应用类时,所述基于所述待打标签的题目的类型信息,确定出待打标签的题目的目标标签,包括:
获取所述待打标签的题目的目标文字信息,所述目标文字信息至少包括所述待打标签的题目的题干、解析;
对所述目标文字信息进行分词、停词处理,得到词特征集合;
计算所述词特征集合中每个词特征的词频与逆文档频率的比值;
基于所述词频与逆文档频率的比值,训练预设分类器,得到目标分类器;
将所述待打标签的题目输入所述目标分类器,输出所述待打标签的题目的目标标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一起教育信息咨询有限责任公司,未经北京一起教育信息咨询有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911301442.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种储能电池接口装置
- 下一篇:一种微波退火装置和微波退火方法