[发明专利]文本阅读难度判断设备及其方法无效
申请号: | 200910118105.6 | 申请日: | 2009-02-23 |
公开(公告)号: | CN101814066A | 公开(公告)日: | 2010-08-25 |
发明(设计)人: | 张洁;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G09B5/00;G09B17/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张浩;李春晖 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 阅读 难度 判断 设备 及其 方法 | ||
1.一种文本阅读难度判断设备,包括:
输入装置,被配置成接收待分析文本、以及有关阅读难度的预定评测主题;
特征量难度评测装置,被配置成针对所述待分析文本的每个组成部分获取用于评测所述预定评测主题的至少一个预定的特征量,针对所述预定特征量计算整个所述待分析文本的相应特征量难度等级,并使用所述特征量难度等级按照该预定特征量所占的预定权重计算有关所述预定评测主题的加权平均信息量,以作为所述待分析文本的有关所述预定评测主题的阅读难度;以及
输出装置,被配置成输出所述待分析文本的有关所述预定评测主题的阅读难度。
2.根据权利要求1所述的文本阅读难度判断设备,其中所述预定评测主题包括所述待分析文本的字形、语音、词汇、语法和/或语义。
3.根据权利要求1所述的文本阅读难度判断设备,其中用于表征所述特征量难度等级的阈值或参数和/或所述预定特征量所占的预定权重是通过机器学习方法获得的。
4.根据权利要求1所述的文本阅读难度判断设备,其中所述待分析文本是汉语文本,所述预定评测主题是所述汉语文本的字形,
所述特征量难度评测装置包括字形难度评测部,被配置成使用所述汉语文本的每个汉字的笔画、部首和结构作为预定特征量来计算所述待分析文本的加权平均字形信息量作为字形阅读难度。
5.根据权利要求1所述的文本阅读难度判断设备,其中所述待分析文本是汉语文本,所述预定评测主题是所述汉语文本的语音,
所述特征量难度评测装置包括语音难度评测部,被配置成基于所述汉语文本的文本拼音信息,使用所述汉语文本中每个汉字的声母、韵母和声调作为预定特征量来计算所述待分析文本的加权平均语音信息量以作为语音阅读难度。
6.根据权利要求5所述的文本阅读难度判断设备,其中所述语音难度评测部进一步包括:
声母难度评测单元,被配置成根据有关汉语声母的现代汉语语音难度等级,对所述汉语文本中各汉字的声母进行难度区分,计算所述汉语文本的声母难度等级;
韵母难度评测单元,被配置成按照单韵母、复韵母和鼻音韵母对所述汉语文本中各汉字的韵母进行难度等级排序,计算所述汉语文本的韵母难度等级;
声调难度评测单元,被配置成根据所述汉语文本内的声调起伏度计算所述汉语文本的声调难度等级。
7.根据权利要求6所述的文本阅读难度判断设备,其中所述声调难度评测单元被配置成基于五度标记法表示所述汉语文本中每个汉字的声调,以获得由“1-5”数字构成的符号序列“T0 T1 T2...Tn”;通过逐个计算“Ti+1-Ti”得到n-1个调差Tx;并且根据如下等式获得与n-1个调差Tx相对应的n-1个难度值D(Tx):
若-4<=Tx<=-2,则其难度D(Tx)=1,
若-1<=Tx<=1,则其难度D(Tx)=0,
若2<=Tx<=4,则其难度D(Tx)=1;
进一步根据声调难度等级计算公式:计算所述汉语文本的声调难度等级T。
8.根据权利要求1所述的文本阅读难度判断设备,其中所述预定评测主题是所述待分析文本的词汇,
所述特征量难度评测装置包括词汇难度评测部,被配置成使用所述待分析文本中的常用词和非常用词信息、词项出现次数信息、虚实词信息以及专有名词和未登陆词信息作为预定特征量来计算所述待分析文本的加权平均词汇信息量,以作为所述待分析文本的词汇阅读难度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910118105.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示屏接口信号自适应转接板
- 下一篇:一种化纤干燥装置