[发明专利]一种面向试题知识点分类的层次化语义匹配方法在审
申请号: | 202210063062.1 | 申请日: | 2022-01-19 |
公开(公告)号: | CN114429138A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 郑彦魁;马震远;马千里;陈海斌 | 申请(专利权)人: | 广州启辰电子科技有限公司;华南理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06N3/04;G06N3/08 |
代理公司: | 北京前审知识产权代理有限公司 11760 | 代理人: | 张静;李亮谊 |
地址: | 510700 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 试题 知识点 分类 层次 语义 匹配 方法 | ||
本发明公开了一种面向试题知识点分类的层次化语义匹配方法。本发明方法首先构建了试题知识点层次化结构,将试题文本语义和知识点层次化语义映射到两者的联合空间中,使用语义匹配方法建模试题文本语义与不同试题知识点层次化结构的匹配关系。该匹配关系由试题知识点层次化结构所决定。具体而言,试题文本语义与试题核心考察的知识点语义是较为匹配的,与无关的知识点语义是不匹配的。在试题知识点分类应用时,本发明方法可以根据试题文本语义与知识点文本语义的匹配距离远近,获得层次化感知的知识点分类结果,该发明方法分类效果较好,具有一定的解释性。
技术领域
本发明涉及自然语言处理中的层次化文本分类领域,具体涉及一种面向试题知识点分类的层次化语义匹配方法。
背景技术
层次化文本分类的任务是,给定一段文本,通过对文本进行分析与建模,给出由通用概念到细粒度概念的分类标签。应用在教育领域,以试题知识点分类为代表,可以预先构建包含大知识领域、小知识考点等的知识点层次化结构。给定若干试题,该任务可以针对性获得试题对应的知识点考察标签。本研究任务可以对电子化试题库进行智能分析与归类,是试题分析、试题智能推荐等场景的基础。在如今智能教育迅速发展的背景下,试题知识点分类有着重要的实践和应用价值。
在试题知识点分类方法方面,国内外使用的模型方法可分为通用文本分类方法和层次感知的文本分类方法。在通用文本分类方法中,已有的中文专利“谭春燕;秦钰森.知识点推荐方法、装置、终端及计算机可读存储介质[P].中国发明专利,CN113590956A,2021-11-02”使用通用文本分类方法对试题进行分析,获得试题对应的语义表示,检索分类获得对应的知识点分类标签。该通用文本分类方法适用于各类分类场景,但对于有明确层次化结构的试题知识点分类而言,如果忽略了知识点形成的由通用概念到细粒度概念的层次化结构,分类的标签可能造成概念混淆,无法获得试题从大知识领域到小知识考点的完整标签。在文献“Huang,Wei,et al.″Hierarchical multi-label text classification:Anattention-based recurrent network approach.″Proceedings of the 28th ACMIhternational Conference on Information and Knowledge Management.2019.”中,Huang等人基于注意力机制,逐层进行知识点分类。当知识点数目较大时,逐层多次判断效率降低,且忽略了试题文本语义和知识点文本语义不同程度的匹配关系。目前该领域存在的问题是,对试题知识点的语义提取不够充分,没有考虑试题文本语义和不同粒度知识点语义的匹配关系。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种面向试题知识点分类的层次化语义匹配方法,该分类方法将试题文本语义和知识点层次化语义映射到两者的联合空间中,使用语义匹配方法建模试题文本语义与不同试题知识点层次化结构的匹配关系。在试题知识点分类应用时,本发明方法根据试题文本语义与知识点层次化语义的语义匹配距离远近,获得层次化感知的知识点分类结果,该发明方法分类效果较好,具有一定的解释性。
与现有技术相比,本发明侧重于提取试题知识点语义向量,构造试题文本语义与知识点文本语义的联合空间,依据语义匹配的程度关系进行知识点分类,从而具有更好的泛化性和准确性,且对于不同类型试题均适用。
本发明的目的可以通过采取如下技术方案达到:
一种面向试题知识点分类的层次化语义匹配方法,该方法包括以下步骤:
S1、根据试题知识点的层次化结构,将知识点标签l=(l1,l2,...lK)(K为知识点标签的数量)构建为试题知识点层次化结构。标签与标签间的连边值表示为e=(el1-l2,el1-l3,...el1-lK),若在试题知识点层次化结构中,两个知识点标签存在联系,则连边值为1,不存在联系则连边值为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州启辰电子科技有限公司;华南理工大学,未经广州启辰电子科技有限公司;华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210063062.1/2.html,转载请声明来源钻瓜专利网。