[发明专利]一种文本质量评价系统及方法有效
申请号: | 202110998121.X | 申请日: | 2021-08-27 |
公开(公告)号: | CN113743085B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 刘三女牙;张立山;赵爱茹;曹欢欢;袁阳凯;李亭亭;戴志诚 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/211;G06F40/289 |
代理公司: | 武汉华之喻知识产权代理有限公司 42267 | 代理人: | 李君;廖盈春 |
地址: | 430079 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 质量 评价 系统 方法 | ||
1.一种文本质量评价系统,其特征在于,包括:顺次连接的数据获取模块、文本分析模块、指标维度计算模块、文本等级评估模块和用户反馈模块;
所述数据获取模块用于收集文本数据;
所述文本分析模块用于对文本数据进行分析,从基本篇幅、知识密度、专业表达和句型结构方面对文本给予反馈;
所述指标维度计算模块用于根据文本分析模块反馈数据,计算指标维度的数值,以评价文本质量;
所述文本等级评估模块的输入端与所述指标维度计算模块的输出端相连;用户反馈模块的输入端与文本等级评估模块的输出端相连;
所述文本等级评估模块用于接收所述指标维度计算模块的各指标维度的数值,对照文本等级标准表,获取各指标维度的等级,并根据历史各指标维度数值与当前各指标维度数值绘制折线图;
用户反馈模块用于向文本创建者反馈各指标维度的数值和折线图,以及将文本指导者对文本的指导建议传递至文本创建者;且向文本指导者反馈文本创建者文本的各指标维度的数值以及各指标维度的等级;
其中,文本等级标准表的建立方法为:根据历史若干文本各指标维度的数值,将各指标维度划分为不同的等级,所有指标维度划分等级的基准表组建为文本等级标准表;
其中,所述指标维度包括:基本篇幅指标维度、知识密度指标维度、专业表达指标维度和句型结构指标维度;
基本篇幅指标维度的计算是统计文本的字、词和句的数目;知识密度指标维度和专业表达指标维度的计算是计算各种词性在总词数中的占比;句型结构指标维度的计算是计算句平均词数以及单句占比;
文本分析模块中基本篇幅的反馈是提供文本的篇幅长度;知识密度的反馈是提供文本的知识量;专业表达的反馈是提升文本创建者遣词造句的建议;句型结构的反馈是文本创建者使用的标点和句子结构是否正确。
2.根据权利要求1所述的文本质量评价系统,其特征在于,所述基本篇幅指标维度的计算包括:统计文本的总字数、计算文本中的总词语数、统计文本中的整句数和统计文本中的分句数;
所述知识密度指标维度的计算包括:计算文本中的名词数除以总词数、计算文本中的连词数除以总词数、计算文本中的介词数除以总词数;
所述专业表达指标维度的计算包括:计算相异词除以总词数、计算文本中的代词数除以总词数、计算文本中的人称代词数除以总词数;
所述句型结构指标维度的计算包括:计算总词数除以整句数和计算整句数除以分句数。
3.根据权利要求1所述的文本质量评价系统,其特征在于,所述文本分析模块用于文本数据分析的单元包括分词词性提取单元、相异词计算单元、句法分析单元和潜在语义分析单元;
所述分词词性提取单元用于采用jieba分词将连续的语句划分为单个词语,并识别词语的词性;
所述相异词计算单元用于使用词袋模型计算文本中的相异词数量;
所述潜在语义分析单元用于采用潜在语义分析方法挖掘词语在文本环境中的使用含义;
所述句法分析单元用于识别句子中词汇之间的依存关系或句子的句法结构,且用于识别标点及其使用频率。
4.根据权利要求3所述的文本质量评价系统,其特征在于,每个指标维度的等级按照从优到劣的顺序依次为专家期、发展期、学习者期、成长期和新手期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110998121.X/1.html,转载请声明来源钻瓜专利网。