[发明专利]一种不良域名识别方法及装置有效
申请号: | 202110540707.1 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113141378B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 曾宇;李洪涛;杨学;刘冰 | 申请(专利权)人: | 中国互联网络信息中心 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L61/4511;G06F16/28;G06F16/245 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 不良 域名 识别 方法 装置 | ||
1.一种不良域名识别方法,其特征在于,所述方法包括:
从域名关系图谱中获得至少一个连通子图,所述连通子图中包括已知类别域名和未知类别域名;
获得所述连通子图的特征矩阵和所述连通子图的邻接矩阵,所述连通子图的特征矩阵用于指示同一个连通子图中每个未知类别域名相对于已知类别域名的相关程度,所述连通子图的邻接矩阵用于指示同一个连通子图中域名之间的连接关系;
所述连通子图的特征矩阵是基于所述未知类别域名的特征向量和所述已知类别域名的特征向量得到的;
所述连通子图的邻接矩阵,通过连通子图中域名之间的连接关系,得到连通子图中每个域名的连接向量,连接向量用于指示该域名与其他域名之间的连接关系;
基于所述连通子图的特征矩阵和所述连通子图的邻接矩阵,识别所述连通子图中未知类别域名的类别,所述未知类别域名的类别用于指示所述未知类别域名是否为不良域名。
2.根据权利要求1所述的方法,其特征在于,所述获得所述连通子图的特征矩阵和所述连通子图的邻接矩阵包括:
基于所述连通子图中域名之间的连接关系,得到所述连通子图的邻接矩阵;
获得所述连通子图中未知类别域名相对已知类别域名的相关程度,并基于所述未知类别域名相对已知类别域名的相关程度,得到所述未知类别域名的特征向量;
获得所述连通子图中已知类别域名的特征向量;
基于所述未知类别域名的特征向量和所述已知类别域名的特征向量,得到所述连通子图的特征矩阵。
3.根据权利要求2所述的方法,其特征在于,所述获得所述连通子图中未知类别域名相对已知类别域名的相关程度,并基于所述未知类别域名相对已知类别域名的相关程度,得到所述未知类别域名的特征向量包括:
基于公式获得所述连通子图中未知类别域名相对已知类别域名的相关程度,在同一连通子图中,xi表示未知类别域名vi的初始特征向量,qj表示已知类别域名节点vj的特征向量,W为注意力网络权重矩阵;
基于公式得到所述未知类别域名vi的特征向量,其中N为连通子图中已知类别域名的数量,αn表示未知类别域名vi与其所属连通子图内第n个已知类别域名的相关程度,qn表示第n个已知类别域名的特征向量。
4.根据权利要求1所述的方法,其特征在于,所述基于所述连通子图的特征矩阵和所述连通子图的邻接矩阵,识别所述连通子图中未知类别域名的类别包括:
调用域名识别模型对所述连通子图的特征矩阵和所述连通子图的邻接矩阵进行处理,得到所述连通子图中未知类别域名的类别,所述域名识别模型是基于各个历史连通子图的特征矩阵、各个历史连通子图的邻接矩阵和各个历史连通子图中各历史域名的真实标签进行训练得到,所述历史域名的真实标签用于指示所述历史域名是否属于不良域名。
5.根据权利要求4所述的方法,其特征在于,所述域名识别模型的训练过程包括:
获得所述各个历史连通子图的特征矩阵和所述各个历史连通子图的邻接矩阵;
将同一个历史连通子图的特征矩阵和邻接矩阵输入到所述域名识别模型中,得到所述历史连通子图中各历史域名的预测标签;
根据所述历史连通子图中各历史域名的预测标签和真实标签,得到损失值,利用所述损失值对所述域名识别模型的模型参数进行调整直至得到的所有损失值中出现最小值,以所述最小值对应的域名识别模型对所述连通子图的特征矩阵和所述连通子图的邻接矩阵进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国互联网络信息中心,未经中国互联网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110540707.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于手势的文本处理方法及系统
- 下一篇:一种真空包装机的气囊式驱动机构