[发明专利]一种基于数理特征提取的数学题文本多标签分类方法在审

专利信息
申请号: 202210485759.8 申请日: 2022-05-06
公开(公告)号: CN114880474A 公开(公告)日: 2022-08-09
发明(设计)人: 侯骏;周从华;朱小龙 申请(专利权)人: 江苏大学
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62;G06N3/04;G06N3/08
代理公司: 南京智造力知识产权代理有限公司 32382 代理人: 汪芬
地址: 212013 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数理 特征 提取 数学题 文本 标签 分类 方法
【权利要求书】:

1.一种基于数理特征提取的数学题文本多标签分类方法,其特征在于,包括如下步骤:

步骤1,采集多套数学试卷中的试题作为样本,形成样本集;并将每道题目的知识点作为样本的标签;

对样本及其标签进行预处理和特征提取,得到样本对应的样本特征向量及样本特征向量对应的标签形成样本特征向量集w={(x1,y1),...(xn,yn)},其中,xi是第i个样本特征向量,yi是第i个样本对应的标签,i=1、2、...、n,n是样本个数;

对样本特征向量进行编码得到隐藏层向量hs;引用自注意力机制计算各个隐藏层向量hs的注意力权重as

基于所得到的注意力权重as,对隐藏层向量进行加权求和,得到文本输出的特征向量

步骤2,将样本集分为训练集和测试集;获取训练集中样本对应的答案解析文本,答案解析文本分为叶节点和根节点,根节点为答案解析的标签文本信息,叶节点为可直接或间接推出根节点标签的文本信息;

对答案解析文本进行预处理和特征提取,得到叶节点文本信息特征及根节点文本信息特征;由叶节点文本信息特征及根节点文本信息特征形成特征先验树的特征矩阵,表示为:v={v1,v2,...vn};

步骤3,对样本特征向量与特征先验树的特征矩阵进行数理特征提取,得到数理特征提取部分的输出结果li

步骤4,将训练集的文本输出的特征向量Fq和数理特征提取部分的输出结果li输入分类器,由分类器输出分类结果;

步骤5,设置训练集的训练停止条件,当训练停止时获得训练好的数学文本多标签分类模型;应用训练好的数学文本多标签分类模型对数学题文本分类。

2.根据权利要求1所述的一种基于数理特征提取的数学题文本多标签分类方法,其特征在于,步骤1和步骤2中均采用Word2vec进行词嵌入,得到特征向量。

3.根据权利要求1所述的一种基于数理特征提取的数学题文本多标签分类方法,其特征在于,样本特征向量进行编码的方法为:

将样本特征向量输入BILSTM模型的编码器中进行编码,输出每个样本特征向量对应的编码;表示为:

得到隐藏层向量其中,表示s时刻BILSTM两个方向的输出向量;LSTM是长短期记忆结构。

4.根据权利要求3所述的一种基于数理特征提取的数学题文本多标签分类方法,其特征在于,引用自注意力机制计算各个隐藏层向量的注意力权重as

us=tanh(Wwhs+bw)

其中,us是s时刻计算得到的向量,s=1、2、...、S,S是编码的总时长;tanh是双曲正切函数,Ww,bw是自注意力机制的权重参数和偏置项;exp是指数函数。

5.根据权利要求1所述的一种基于数理特征提取的数学题文本多标签分类方法,其特征在于,数理特征提取部分由多个基特征提取组成,在每个基特征提取中,将样本特征向量和特征先验树的特征矩阵中的向量vi表示为:

li=f(w,vi,Wi1,Wi2)

其中,li是基特征提取的输出,f函数即是对w,vi向量做cosine和compare运算;Wi1是用于w和vi进行consine计算的参数矩阵,Wi2是用于与计算得到的cosine值做compare的校验参数矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210485759.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top