[发明专利]文本阅读难度判断设备及其方法无效
申请号: | 200910118105.6 | 申请日: | 2009-02-23 |
公开(公告)号: | CN101814066A | 公开(公告)日: | 2010-08-25 |
发明(设计)人: | 张洁;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G09B5/00;G09B17/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张浩;李春晖 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 阅读 难度 判断 设备 及其 方法 | ||
技术领域
本发明涉及自然语言分析处理技术,具体地涉及从输入的文本符号序列中判断文本阅读难度的设备和方法。
背景技术
在语言教学和学习过程中,通常涉及到语音、字形、词汇、语法和/或语义等多方面语言要素的教学和学习,循序渐进是选择制定教材的原则,如何将抽象的循序渐进进行科学的量化,如何科学地选择、编纂难度适宜的文本教材一直是一个亟待解决的问题。
关于这方面的研究已发表了多篇论文和专利,例如:
中国专利CN1645356A,发明人-曲万波,多维汉语学习系统;
中国专利CN1236928A,发明人-郭巧,郭扬;计算机辅助汉语智能教学系统及其实现方法;
日本专利特願2001-17443,发明人-橋本岳,吉川信也;安陪稔;学習支援システム;
日本专利特願2004-126154,发明人-宮健三;单語の木にょゐ効果的な学習方法;
日本专利特愿平4-351424,发明人-赤尾弘;中国语学习装置;
美国专利US5802533,发明人-Randall C.Walker,Text processor。
上述现有技术所提供的这些方法都以向学习者呈现具体的语言学习项目为目的,例如字、词、句、语法等,尚未以语言教材编撰或者语言测试材料的选择为应用领域,也尚未综合运用汉语的语音、字形、词汇、语法、语义等语言学特征。
发明内容
本发明的目的在于提供一种不同于现有技术的进行文本阅读难度判断的设备及方法,用以从输入的待分析文本(例如汉语文字符号序列)中判断出其字形难度、语音难度、词汇难度、语法难度、语义难度和/或综合难度,从而解决汉语教材编撰、汉语水平考试的区分度和/或汉语水平科学量化等问题。
根据本发明的一个方面,一种文本阅读难度判断设备,包括:输入装置,被配置成接收待分析文本、以及有关阅读难度的预定评测主题;特征量难度评测装置,被配置成针对所述待分析文本的每个组成部分获取用于评测所述预定评测主题的至少一个预定的特征量,针对预定特征量计算整个所述待分析文本的相应特征量难度等级,并使用所述特征量难度等级按照该预定特征量的预定权重计算有关所述预定评测主题的加权平均信息量,以作为所述待分析文本的有关所述预定评测主题的阅读难度;以及输出装置,被配置成输出所述待分析文本的有关所述预定评测主题的阅读难度。
优选地,所述预定评测主题包括所述待分析文本的字形、语音、词汇、语法和/或语义。在所述预定评测主题包括字形、语音、词汇、语法和语义中至少两个的情况下,所述文本阅读难度判断设备还包括连接在所述特征量难度评测装置和输出装置之间的综合评测装置,被配置成使用由所述特征量难度评测装置计算获得的与所述至少两个评测主题相关的至少两个阅读难度,按照所述至少两个评测主题的预定权重综合计算所述待分析文本的综合阅读难度。
优选地,所述文本阅读难度判断设备还包括连接在所述输入装置和特征量难度评测装置之间的文本预处理装置,被配置成获取所述待分析文本的语音、词汇、句子、语法和/或语义信息。例如在所述预定评测主题包括字形、语音、词汇、语法和语义中至少两个的情况下,首先对待分析文本进行预处理,利用自然语言处理技术对文本进行断句、分词及词性标注和拼音标注,得到标注文本;将标注文本送入各个特征量难度评测装置进行分析评测,计算字形、语音、词汇、语法、语义等各项语言学参数的难度指数,最终通过综合评测装置,输出该待分析文本的阅读难度。
根据本发明的另一方面,一种判断文本阅读难度的方法,包括:接收待分析文本、以及有关阅读难度的预定评测主题;针对所述待分析文本的每个组成部分获取用于评测所述预定评测主题的至少一个预定特征量,针对预定特征量计算整个所述待分析文本的相应特征量难度等级,并使用所述特征量难度等级按照该预定特征量所占的预定权重计算有关所述预定评测主题的加权平均信息量,以作为所述待分析文本的有关所述预定评测主题的阅读难度;以及输出所述待分析文本的有关所述预定评测主题的阅读难度。
本发明的有益效果在于,基于自然语言成分的构成规律,对文本符号的字形、语音、词汇、语法、语义五方面的学习难度进行量化分析和评测。
本发明可以作为一个独立的评价系统对随机的自然语言文本阅读难度进行评测,尤其适合解决面向自然语言教学的教材编写和测试材料选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910118105.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示屏接口信号自适应转接板
- 下一篇:一种化纤干燥装置