[发明专利]一种关于英语阅读理解测试疑问式简答题的自动化命题方法有效
申请号: | 201410064433.3 | 申请日: | 2014-02-25 |
公开(公告)号: | CN103823794A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 黄妍;何莲珍 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N5/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关于 英语 阅读 理解 测试 疑问 答题 自动化 命题 方法 | ||
1.一种关于英语阅读理解测试疑问式简答题的自动化命题方法,包括如下步骤:
(1)自然语言处理;
1.1利用自动句法标注器对文章中的句子进行句法分析,得到句子的短语结构和词法信息;所述的词法信息包括句子中各名词的数以及各动词的时态和体态;
1.2利用自动语义角色标注器提取所述句子中述语动词指派给所在句中各句子成分的语义角色;所述的句子成分为单词、短语或从句;
1.3利用自动指代消解器提取所述句子中代词所指的句子成分;
1.4利用自动词汇范畴标注器提取所述句子中实词和固定短语的词汇范畴;
1.5利用语料库结合HAL法与LSA法,计算得到词典范围内所有单词的语义向量;
(2)考点选取;
2.1计算文章中句子的词频密度;
2.2计算文章中每个段落应选的考点数目;
2.3取所述句子中所有单词的语义向量的几何中心作为句子的语义向量,进而计算文章中每个句子与其他句子的句义近似度;
2.4按词频密度从高到低的顺序对文章中句子进行排序,依次判断每个句子是否被选为考点;
(3)问句生成;
3.1对于被选为考点的句子,根据句子的词法信息和各句子成分的语义角色建立句子基于词汇功能语法理论的功能结构;
3.2使功能结构中的独立功能体均作为提问对象;所述的独立功能体是指功能结构中以子功能结构作为明细的属性,其包括主语、宾语、间接宾语以及附加语;
3.3对于任一提问对象,确定该提问对象的中心语,进而根据中心语的词汇范畴以及提问对象的语义角色确定提问对象的疑问词;
3.4在被选为考点的句子中使该疑问词代替提问对象,进而根据所述的短语结构和功能结构对该句子中的句子成分做主谓倒装和时数一致性调整,生成以该疑问词引导的特殊疑问句;
3.5根据步骤3.3~3.4遍历每一个提问对象,生成多个特殊疑问句;
(4)同义改写;
4.1对文章中的实词或固定短语进行语义消歧,以确定实词或固定短语在特殊疑问句中的语义;
4.2对于特殊疑问句中的任一实词或固定短语,判断该实词或固定短语的语义是否为词典中该实词或固定短语的高频义项,若是则进入步骤4.3,若否,则不对该实词或固定短语做同义改写;
4.3根据语义利用词典获取该实词或固定短语的同义词集合,依次对集合中的同义词进行判断:对于集合中的任一同义词,判断该实词或固定短语的语义是否也是词典中该同义词的高频义项,若是则进入步骤4.4,若否,则判断集合中的下一个同义词;
4.4判断该同义词是否超出阅读理解测试所指定的词汇范围,若否,则将该同义词替换该实词或固定短语,若是,则判断集合中的下一个同义词;
4.5根据步骤4.2~4.4遍历特殊疑问句中的所有实词或固定短语;
4.6对于特殊疑问句中的任一代词,判断该代词所指的句子成分是否也在该特殊疑问句中,若是,则不对该代词做同义改写,若否,则进一步判断该特殊疑问句中是否存在另一个代词所指的句子成分与该代词的所指相同且该另一个代词在特殊疑问句中处于该代词前面的情况,若是,则不对该代词做同义改写,若否,则用该代词所指的句子成分替换该代词。
2.根据权利要求1所述的自动化命题方法,其特征在于:所述的步骤1.5中结合HAL法与LSA法得到词典范围内所有单词的语义向量的具体过程为:首先,从语料库中获取单词共现关系矩阵,该矩阵中任一元素的取值为该元素所在行和列分别对应的两个单词在语料库中共同出现的次数;然后,对该共现关系矩阵进行奇异值分解,得到词典范围内所有单词的语义向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410064433.3/1.html,转载请声明来源钻瓜专利网。