[发明专利]使用浅层句法分析器自动评估句子的自动句子评估装置及其错误检测设备和方法有效
申请号: | 201280019540.3 | 申请日: | 2012-10-24 |
公开(公告)号: | CN103493041A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 金承焕;金东南;李银淑;金星 | 申请(专利权)人: | SK电信有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚;刘久亮 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 句法 分析器 自动 评估 句子 装置 及其 错误 检测 设备 方法 | ||
技术领域
本公开涉及用于自动评估句子撰写的错误检测,更具体地讲,涉及一种用于自动评估句子的设备和方法以及针对此目的的错误检测设备,其将撰写的输入句子分割成词素,将词性(parts of speech)标注到所分割出的词素,检测各个词性串的简单语法英语撰写错误,并且基于由彼此相邻的词性的连接关系限定的规则来对它们进行句法分析,以提高撰写评估的准确度。
背景技术
近来,韩国SAT和企业分级评估已改变为根据说和写的实际英语表现评估。
即,教育部已开发出NEAT(国家英语能力测试,它是听、阅读理解、说和写的基于互联网的评估)并通过示范来进行实施,并且计划取代公务员考试和SAT的英语测试。在这些英语表现评估中,引入自动撰写评估系统来评估写作能力。
自动撰写评估系统从语法上分析撰写的句子并通过错误检测来评估它是否按照语法撰写。在这种情况下,在分析撰写的句子的处理中,必然需要将句子分割成词素,将词性标注到各个词素,并执行句法分析的处理。然而,传统句法分析未复杂地考虑词汇、词性、含义和上下文相关性,而是仅依赖于词性串信息,由此存在准确度显著降低的问题。
具体地讲,由于自然语言中存在上下文具有相互依赖关系的各种现象,所以通常定义的语法在句法分析方面存在局限。例如,在通过句法分析(syntax analysis)将词句法分析(parse)为“动词”的情况下,由于相邻词的词性,可将其句法分析为“名词”,而非“动词”。在这种情况下,存在通过句法分析提取两个或更多个句法树并且其句法分析变得有歧义的问题。
因此,需要一种通过对标注的输入句子的相邻词性之间的连接关系执行正确的句法分析来增强自动评估系统的解决方案。
发明内容
技术问题
根据一些实施方式,提供了一种使用浅层句法分析器(shallow parser)的自动句子评估装置、错误检测设备及相关方法,由此通过针对撰写的输入句子利用n-gram生成词性串并基于根据相邻词性之间的连接关系定义的规则(浅层句法分析)对所生成的词性串进行句法分析来检测简单语法错误和句子结构错误,针对所检测出的错误提示校正草案,从而增加句子评估的准确度。
技术方案
根据一些实施方式,一种用于自动评估句子的设备包括输入句子分割器、词性标注部、句法分析器、句子评估部和错误检测器。所述输入句子分割器被构造为将撰写的输入句子分割成词素,所述词素是句子的最小单元。所述词性标注部被构造为将词性标注到所分割出的词素。所述句法分析器被构造为基于词性分析句子的句法结构并输出句法树作为分析结果。所述句子评估部被构造为利用由所述句法分析器输出的句法树来评估所述句子语法上是否正确。所述错误检测器被构造为针对由所述词性标注部标注的各个词性利用n-gram生成词性串,基于根据彼此相邻的词性之间的连接关系定义的正则语法规则和上下文无关语法规则分析所生成的词性串以检测句法分析的错误,并针对所检测出的错误提供校正。
根据一些实施方式,一种利用浅层句法分析器来自动评估句子的撰写的错误检测设备包括词性串生成器、浅层句法分析器、错误检测器和错误校正部。所述词性串生成器被构造为针对标注到输入句子的各个词性,利用n-gram按照特定窗口单位生成词性串。所述浅层句法分析器被构造为基于上下文无关语法规则和正则语法规则来对所述词性串进行句法分析,并且计算所述词性串的亲密度。所述错误检测器被构造为根据由所述浅层句法分析器计算出的亲密度来检测错误。所述错误校正部被构造为针对由所述错误检测器检测出的错误提供校正。
根据一些实施方式,一种利用浅层句法分析器来自动评估句子的撰写的错误检测方法包括以下步骤:针对标注到输入句子的各个词性,利用n-gram按照特定窗口单位生成词性串;基于上下文无关语法规则和正则语法规则来对所述词性串进行句法分析,从而计算所述词性串的亲密度;根据所计算出的亲密度来检测错误;以及针对所检测出的错误提供校正。
有益效果
根据本文公开的实施方式,通过考虑语言的典型规则以及相邻词性之间的依赖关系分析撰写的输入句子,具有这样的效果:检测语法错误的准确度增加,以增强自动句子评估的能力。
另外,通过根据预定模式生成词性串并以所生成的词性串为单位执行分析,具有这样的效果:与传统的全句法分析相比,句法分析的歧义减少,并且能够详细检测错误的类型。
附图说明
图1示出根据至少一个实施方式的用于自动撰写评估的错误检测设备的构造。
图2示出根据至少一个实施方式的错误检测设备的详细构造。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SK电信有限公司,未经SK电信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280019540.3/2.html,转载请声明来源钻瓜专利网。