[发明专利]一种基于标准答案的知识点自动提取方法及系统在审
申请号: | 201710272107.5 | 申请日: | 2017-04-24 |
公开(公告)号: | CN107169043A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 王庆先 | 申请(专利权)人: | 成都准星云学科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/04 |
代理公司: | 北京卓唐知识产权代理有限公司11541 | 代理人: | 唐海力 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标准答案 知识点 自动 提取 方法 系统 | ||
技术领域
本发明涉及自动推理技术、知识抽取领域,特别是涉及一种基于标准答案的知识点自动提取方法及系统。
背景技术
知识抽取是指从数字资源中识别、发现和提取出概念、类型、事实及其相关关系、约束规则,以及进行问题求解的步骤、规则的过程。(参考《当前知识抽取的主要技术方法解析》,张智雄等,现代图书情报技术,2008年第8期)目前,大多数的知识点抽取集中在设计自动或半自动的算法,从非结构化和半结构化文本中提取结构化信息,即从现有的(自然语言)文档中提取知识。比如,北京师范大学的刘晓娟在研究利用知识抽取技术,对数字图书馆中海量的数字信息资源进行一系列处理,使得用户更易于查询和理解,机器更易于自动处理。又比如,GATE、KIM、ArtEquAKT等国外的知识抽取系统主要应用在数字图书馆中的文档标注和处理、生物信息学、为语义web生成元数据,提高标引、检索、分类和过滤应用的效率等。可见,不管是国内还是国外,对“知识抽取”的应用只限于从文本中提取出人们所需要的信息,虽然有自然语言理解相关技术,但是没有推理机制,显得单一。
发明内容
本发明要解决的技术问题是,如何提供具有知识点标注的标准答案给老师来了解学生对知识点的掌握情况,同时能够提高学生对题目答案的学习、理解的知识点自动提取方法。
解决上述技术问题,本发明提供了一种基于标准答案的知识点自动提取方法,包括如下步骤:
对题目和对应的标准答案进行自然语言理解,结果作为源知识集,
将所述源知识集放入一推理机中,并根据规则库使用drools规则引擎训练得到一知识库,
根据所述知识库依次对所述标准答案中的每个解答步骤进行比较,提取并标记出知识点。
更进一步,对题目和对应的标准答案进行自然语言理解具体包括:
2-1)实体标注,将题目和对应的标准答案到的文本中实体用事先定义的符号标记,作为统一文本形式的模板,
2-2)模板匹配,对所述模板按照同一类型构成同一个XML文件。
更进一步,将所述源知识集放入一推理机中后还包括如下的步骤:
3-1)定义实体与关系两个概念,
3-2)基于包括已知事实和规则的产生式规则引擎,
3-3)通过所述产生式规则引擎训练一知识库。
更进一步,所述推理机中的推理规则包括:
4-1)将给定的已知事实插入到事实库中;
4-2)利用模式匹配对规则库中的规则和事实库中的已知事实进行匹配;
4-3)若多个所述规则同时满足条件且处于激活状态,则存在冲突性规则,同时将冲突的所有规则放入冲突集合中;
4-4)将用以处理激活状态的规则按设定顺序放入所述冲突集中并处理冲突;
4-5)利用执行引擎执行所述冲突集中的规则,重复以上步骤4-2)至4-4),直至所述冲突集没有处于激活状态的规则。
更进一步,根据所述知识库依次对所述标准答案中的每个解答步骤进行比较的方法如下:
源知识集中的经过自然语言理解处理后的标准答案的文本作为知识与知识库中的内容作比较;
若所述标准答案的文本是题干中的已知条件,则不作处理;
若所述标准答案的文本是由已知条件推导而来,则在知识库中查找每个关系所对应的条件集及规则名;
若标准答案推导过程中所用的条件与知识库中的查找到的条件相匹配,则将知识库中对应的规则名提取出来自动标注为知识点。
更进一步,若所述标准答案的文本作为知识存在,则查找该知识的父亲节点,将所述知识库中推导出该知识的条件集,同时获取推导出该知识规则的知识点并进行标记,如果该知识不存在,则该步骤不标记。
更进一步,若所述标准答案的文本作为知识存在,而对同一知识由不同的条件集产生,则在所述知识库中每一个知识节点有两个属性,一个是条件集即该知识节点的父亲节点;另一个是规则名即推理出该知识所对应的知识点,则,选取所述知识库中与当前答案的文本中上一步等价的条件集作为当前知识的父亲结点进行推理,获取与该条件集同组的规则名作为知识点进行标记。
基于上述本发明还提供了一种基于标准答案的知识点自动提取系统,包括:知识采集单元、知识处理单元以及知识点提取单元,
所述知识采集单元,用以对题目和对应的标准答案进行自然语言理解,结果作为源知识集,
所述知识处理单元,用以将所述源知识集放入一推理机中,并根据规则库使用drools规则引擎训练得到一知识库,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都准星云学科技有限公司,未经成都准星云学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710272107.5/2.html,转载请声明来源钻瓜专利网。