[发明专利]基于领域知识库的计算机网络协议实体链接方法和系统有效
| 申请号: | 202010025957.7 | 申请日: | 2020-01-10 |
| 公开(公告)号: | CN111259087B | 公开(公告)日: | 2022-10-14 |
| 发明(设计)人: | 李守斌;明旭冉;刘雨江;崔闻早;胡军;王青 | 申请(专利权)人: | 中国科学院软件研究所 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28 |
| 代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 领域 知识库 计算机网络 协议 实体 链接 方法 系统 | ||
本发明公开了一种基于领域知识库的计算机网络协议实体链接方法和系统。该方法包括:构建一个网络协议语义知识库,作为协议实体链接方法的指导;在网络协议实体文本中形成协议信息数据集;在数据集上进行预训练模型的微调,该微调模型将作为联合模型的一部分;设计并训练一个由线性层和非线性层两部分组成网络协议领域模型,该领域模型作为联合模型的另一部分;融合上述两个模型的输出,将融合结果输入分类层进行分类,得出最终的实体链接结果。本发明能够更好的挖掘网络协议描述文档中的深层语义信息,有助于网络协议方面的研究。
技术领域
本发明属于计算机技术领域,提出一种基于计算机网络领域知识库的网络协议实体链接方法和系统。该方法创新性设计并实现了一种联合模型,模型在保留了预训练模型优点的基础上,融合了自主设计的领域模型,提升了从计算机网络协议实体到领域知识库链接过程的效率和准确度,对计算机网络领域的研究有着重要的意义。
背景技术
计算机网络是由空间上分散的一群计算机或终端,通过通信设备和线路连接组成的复杂网络。计算机网络以信息传输为基础目的,具有包括数据通信、资源共享、集中管理、分布式处理等在内的多种功能。为对计算机网络进行规范和约束,需要计算机网络协议。计算机网络协议是一些为确保计算机网络中的数据正常交换而建立的规则、标准或约定的集合。由于计算机网络中存在大量计算机或终端,其连接情况多种多样,复杂网络情况产生了大量的计算机网络协议。并且由于其大多以自然语言的形式进行描述,文本又缺乏结构化,对计算机网络协议的研究存在不少困难。
信息化时代,人们对网络的依赖日益增强,通过网络获得和交流信息已成为现代信息社会的一个重要特征。这些网络系统都依靠计算机网络接收和处理信息,实现相互间的联系和对目标的管理、控制,计算机网络的重要性可见一斑。然而随着计算机网络重要性的提升,计算机网络安全问题也将日益凸显。加强计算机网络的深入研究,了解掌握计算机网络通信过程和协议规范,对维护计算机网络安全意义重大。
在人工智能的知识工程领域,知识库是指专家系统设计所应用的规则集合,具有很强的领域特征的结构化信息。建立知识库的过程中,大量隐含知识被编码和数字化处理,信息和知识从原来的混乱状态变得有序,在此基础上,有助于加快知识的流动,有利于知识的交流和深入研究。所谓实体链接,即将存在于计算机网络协议中的文本信息进行抽取、分类,并与知识库中的知识建立联系的过程,计算机网络领域知识库的建立将为我们模型中的实体链接提供专业依据。
相对于结构化的信息,由于计算机网络协议大多以自然语言形式进行描述,对计算机来说比较难以理解和分析,目前关于计算机网络协议实体链接还没有良好的解决方案。
发明内容
为了解决上述问题,本发明利用人工智能领域的自然语言处理对计算机网络协议文本进行分析和处理,实现实体链接过程,提升实体链接过程中的准确度。
本发明采用的技术方案如下:
一种基于领域知识库的计算机网络协议实体链接模型构建方法,其特征在于,包括以下步骤:
根据专家知识构建计算机网络协议知识库;
以所述计算机网络协议知识库为学习的先验知识,从计算机网络协议文本中提取待进行实体链接的实体,所述实体包含字段和描述信息,由字段和描述信息构成网络协议信息数据集;
将自然语言预训练模型在所述网络协议信息数据集上进行微调,得到微调后的自然语言预训练模型;
利用所述网络协议信息数据集,训练基于神经网络的网络协议领域模型;
将所述微调后的自然语言预训练模型和所述网络协议领域模型进行融合,得到计算机网络协议实体链接模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010025957.7/2.html,转载请声明来源钻瓜专利网。





