[发明专利]一种针对小学生作文辅导的作文要素分析算法有效
| 申请号: | 201910521472.4 | 申请日: | 2019-06-17 |
| 公开(公告)号: | CN110222344B | 公开(公告)日: | 2022-09-23 |
| 发明(设计)人: | 赖伟;周昌伟;吴义坚 | 申请(专利权)人: | 上海元趣信息技术有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N3/02 |
| 代理公司: | 北京七夏专利代理事务所(普通合伙) 11632 | 代理人: | 王彦丽 |
| 地址: | 200000 上海市浦东新区自由贸易实*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 小学生作文 辅导 作文 要素 分析 算法 | ||
1.一种针对小学生作文辅导的作文要素分析算法,其特征在于,包括以下步骤:
S1:初始化;
S2:录入需分析的作文;
S3:对作文做结构分段处理;
S4:对作文做写作要素点提取和分析;
S5:给出作文分析结果;
其中,所述的S3包括以下步骤:
A1:将作文按命题进行层次化分类,为每类作文都精心设计结构组成部分;
A2:根据大量的范文标注和数据分析,建立文本分段和标注的数据模型;
A3:采用机器学习的算法,将学生习作作文进行自动的分段结构分析;
其中,所述的A3包括:
B1:基于输入文本的自然标点信息进行初步分割,根据文本中的回车换行符、句号以及表示句子结束的叹号、问号,将文本分割成一组句子级别的单元,简称句单元;
B2:对每个句单元文本,进行各自的语义分析,包括语法分析和词法分析,提取出关键成分;
B3:运用文本主题模型和文本自动摘要技术,为每个句单元提取标注一些关键词;
B4:将句单元聚类,形成段落;
B5:将聚类形成的段落进行标注,判定此段落是否属于某类作文;
其中,所述B4中聚类的依据为:一是直接计算各个句单元对直接的文本相似度,二是根据上一步骤每个句单元提取处理的关键成分以及关键词摘要来计算,同时也结合每个句单元的字数长度基础信息。
2.根据权利要求1所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的S4包括以下步骤:
C1:建立形容词、副词、动词的词典,词汇选取上侧重小学语文教学大纲涵盖的范围;
C2:引入自然语言处理学术领域上经典的语料数据,配合互联网上海量文本数据和社交网络丰富的资源,建立一个针对小学生作文领域的词汇本体库;
C3:构建一个3层的神经网络,含有一个输入层、一个隐含层和一个输出层;
C4:通过对已标注作文数据的分析处理,对于一个要素点,提取出包含的所有关键词,根据词汇本体库,对这些关键词进行聚类,并记录词的类别分布和权重;
C5:遇到新的待分析的作文时,将文本分词,然后逐个词语进行计算对比,如果和某个要素点的关键词类别分布接近,列入候选,最后计算各个候选的归一化得分,排序后,输出概率最高的候选项,即为这段作文可能包含的要素点;
C6:建立一个专家系统,通过标注数据来设计一个规则模板组成决策流程;
C7:依照决策流程依次判决,最终得到目标的要素点;
C8:将原文中含有相对应要素的句子和相应的关键词汇,进行高亮显示。
3.根据权利要求2所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的专家系统的构建方法:
D1:搜集大量的,各个年级小学生的范文和真实作文作业,请有经验的教研老师进行了标注,即将作文中含有的写作要素点标注出来,并且给出对应的文字范围,以及重要的关键词和词组特征;
D2:定义一整套的文本特征单元,从细到粗,分为:字,词,词组,短语,子句,分句,从句,整句,句群,段落,章节,篇章;
D3:在各级别单元上,分别可以定义一系列的规则和模式,以类文法语言描述。
4.根据权利要求2所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的C3中的神经网络中输入层输入的为一段上下文环境的文本片段,输出层引入softmax函数来预测此段上下文的中心词的概率;输入层到隐藏层的神经网络参数即为每个词的嵌入表达,亦可成为词向量,是一个200维的浮点数向量;得到词向量之后,任意两个词的语义关系,可简单理解为近义程度,可以通过两个词的词向量计算所得;反之,给定一个词,可以搜索计算它的同义词。
5.根据权利要求2所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的神经网络的构建方法为:
首先,构建机器学习算法框架中需要的训练集、验证集和测试集;将标注的作文文本,格式化成神经网络的输入数据,即将已经标注出要素集合,作为各段文本的多类标签;采用多层的循环神经网络来构建模型;在隐藏层,引入了双向长短时记忆单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海元趣信息技术有限公司,未经上海元趣信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910521472.4/1.html,转载请声明来源钻瓜专利网。





