[发明专利]基于深度学习的大学计算机基础知识图谱构建方法有效
| 申请号: | 202010132852.1 | 申请日: | 2020-02-29 |
| 公开(公告)号: | CN111339318B | 公开(公告)日: | 2023-05-05 |
| 发明(设计)人: | 朱磊;刘尧林;黑新宏;吕泓瑾;冯林林;张晋源;王一川;姬文江;孟海宁 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/295 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 曾庆喜 |
| 地址: | 710048*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 大学 计算机基础知识 图谱 构建 方法 | ||
本发明公开了一种基于深度学习方法的大学计算机基础知识图谱构建方法;采用BERT‑IDCNN‑CRF算法训练知识点实体识别模型,从大学计算机基础课本文本内容中自动抽取知识点实体;采用BERT‑BiLSTM‑CNN算法训练关系识别模型,自动抽取知识点实体之间的关系;基于word2vec生成知识点实体词向量,通过计算知识点实体之间的相似度进行实体消歧。大大减少了人工构建大学计算机基础知识图谱的工作量,省时省力。
技术领域
本发明属于人工智能领域的一个重要方向,具体涉及一种基于深度学习的大学计算机基础知识图谱构建方法。
背景技术
伴随着信息技术发展的突飞猛进,人工智能技术已经延伸到各行各业,并与许多传统行业有效地结合到一起,其中“互联网+教育”的模式应用十分广泛。大学计算机基础对于当代大学生是一门非常重要的基础课,这门课程涵盖了关于计算机的多个方面,包含计算机的起源与发展、硬件组成、操作系统、计算机网络、算法与数据结构、常用的办公软件操作等内容。通过学习大学计算机基础这门课程,学生对计算机的历史,计算机的组成结构、工作方式,计算机网络的工作机制,程序的设计可以有一个科学清楚的认识。
但是由于大学计算机基础知识面覆盖广,知识点较为繁杂,大部分学生难以系统地掌握所学知识点,对知识点的理解是孤立零散的,而效果好的学习应该对知识点的掌握是系统化的,结构清晰的。所以将大学计算机基础的知识点构建成知识图谱,利用知识图谱强大的语义处理能力和开放互联能力解决这个问题是十分有必要的。而人工构建知识图谱的工作量是十分巨大的,需要耗费大量的人力物力。本发明采用基于深度学习的方法训练模型,经过训练的模型可以自动抽取大学计算机基础课本文本内容中的实体以及实体之间的关系,减少了人工构建图谱的工作量。
发明内容
本发明的目的是提供一种基于深度学习方法的大学计算机基础知识图谱构建方法,解决了现有技术中存在的人工构建知识图谱工作量大,费时费力的问题。
本发明一种基于深度学习方法的大学计算机基础知识图谱构建方法,采用BERT-IDCNN-CRF算法训练知识点实体识别模型,从大学计算机基础课本文本内容中自动抽取知识点实体;采用BERT-BiLSTM-CNN算法训练关系识别模型,自动抽取知识点实体之间的关系;基于word2vec生成知识点实体词向量,通过计算知识点实体之间的相似度进行实体消歧。
知识图谱构建方法具体包括以下步骤:
步骤1,对知识点实体识别训练集的语料进行预处理,分离文本中的标点符号,将文本以句号划分以及词性标注;
步骤2,使用BERT-IDCNN-CRF算法进行训练生成知识点实体识别模型;
步骤3,对关系识别训练集的语料进行预处理,分离文本中的标点符号,将文本以句号划分以及词性标注;
步骤4,使用BERT-BiLSTM-CNN算法进行训练生成关系识别模型;
步骤5,对大学计算机基础课本文本内容进行预处理,分离文本中的标点符号以及将文本以句号划分;
步骤6,将步骤5预处理过的大学计算机基础课本内容输入步骤2生成的知识点实体识别模型中,抽取知识点实体;
步骤7,对步骤6获取到的知识点实体采用基于word2vec计算知识点实体相似度的方法对知识点实体表达的歧义进行消除;
步骤8,对大学计算机基础课本的各级目录通过人工筛选的方式获取知识面实体;
步骤9,将步骤6、步骤7提取的知识点实体、知识面实体储存到实体数据库;
步骤10,将步骤5预处理过的大学计算机基础课本内容输入步骤4生成的关系识别模型中,抽取知识点之间的关系;
步骤11,基于匹配算法提取知识面实体之间,知识面实体与知识点实体之间的关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010132852.1/2.html,转载请声明来源钻瓜专利网。





