[发明专利]域名识别方法及装置、存储介质及电子设备在审
申请号: | 201910899351.3 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110674370A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 张伟哲;乔延臣;张宾;武化龙 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06N3/04;G06N3/08 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 李伟 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 域名识别 关键字信息 检测信息 预处理 关键字提取 存储介质 电子设备 提取规则 预先设置 构建 应用 攻击 检测 | ||
1.一种域名识别方法,其特征在于,包括:
获取待识别域名;
按预先设置的提取规则,对所述待识别域名进行关键字提取,得到所述待识别域名对应的关键字信息;
对所述关键字信息进行预处理,得到与所述待识别域名对应的检测信息;
将所述检测信息输入至预先构建的域名识别模型中,得到与所述待识别域名对应的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述按预设的提取规则,对所述待识别域名进行关键字提取,得到所述待识别域名对应的关键字信息,包括:
确定所述待识别域名的域名类型;
若所述待识别域名的域名类型为二级域名,则提取所述待识别域名中的第二级域名,以得到所述待识别域名对应的关键字信息;
若所述待识别域名的域名类型为三级域名,则判断所述待识别域名中的第二级域名是否表征为动态域名服务商的域名,若表征为动态服务商的域名,则提取所述待识别域名的第三级域名,以得到所述待识别域名对应的关键字信息;若不表征为动态服务商的域名,则提取所述待识别域名中的目标域名,以得到所述待识别域名对应的关键字信息;
若所述待识别域名的域名类型为三级以上的域名;则提取所述待识别域名中的目标域名,以得到待识别域名对应的关键字信息;
其中,所述目标域名为所述待识别域名的各个级别的域名中,字符串长度最长的域名。
3.根据权利要求1所述的方法,其特征在于,对所述关键字信息进行预处理,得到与所述待识别域名对应的检测信息,包括:
确定所述关键字信息的字符串长度;
判断所述字符串长度是否小于预先设置的长度阈值;
若所述字符串长度小于预先设置的长度阈值,则应用预先设置的补齐字符,对所述关键字信息进行补齐操作,使已进行补齐操作的所述关键字信息的字符串长度与所述长度阈值一致;并将已进行补齐操作的所述关键字信息进行向量化,得到与所述待识别域名对应的检测信息。
4.根据权利要求1所述的方法,其特征在于,所述域名识别模型的构建过程,包括:
获取预先设置的各个训练数据,所述训练数据包含训练域名和所述训练域名的标签信息;
确定各个所述训练域名对应的检测信息;
依次将各个所述训练域名对应的检测信息输入至初始神经网络模型,直至所述初始神经网络模型的网络参数满足预先设置的训练条件;
其中,将每个所述训练数据包含的检测信息输入至所述初始神经网络模型时,得到当前输入至所述初始神经网络模型的检测信息对应的识别结果;调用预先设置的损失函数,对所述识别结果与当前输入至所述初始神经网络的检测信息对应的标签信息进行计算,得到损失函数值;依据所述损失函数值,判断所述初始神经网络模型的网络参数是否满足所述训练条件;若不满足,则依据所述损失函数值调整所述初始神经网络模型的网络参数;若满足,则将所述初始神经网络模型确定为域名识别模型。
5.根据权利要求1所述的方法,其特征在于,所述域名识别模型的构建过程,包括:
获取预先设置的各个训练数据,所述训练数据包含训练域名和所述训练域名的标签信息;
确定各个所述训练域名对应的检测信息;
依次将各个所述训练域名对应的检测信息输入至初始神经网络模型,直到输入至所述初始神经网络模型的检测信息的数量满足预设的数量阈值时,将当前所述初始神经网络模型确定为域名识别模型;
其中,将每个所述检测信息输入至所述初始神经网络模型时,得到当前输入至所述初始神经网络模型的检测信息的识别结果;调用预先设置的损失函数,对所述识别结果与当前输入至所述初始神经网络的检测信息对应的标签信息进行计算,得到损失函数值;依据所述损失函数值调整所述初始神经网络模型的网络参数。
6.根据权利要求1所述的方法,其特征在于,所述将所述检测信息输入至预先构建的域名识别模型中,得到与所述待识别域名对应的识别结果,包括:
将所述检测信息输入至预先构建的域名识别模型时,确定所述检测信息与所述域名识别模型的各个预设的输出标签对应的预测概率值;
在各个所述输出标签中,将数值最大的预测概率值所对应的输出标签确定为与所述待识别域名对应的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910899351.3/1.html,转载请声明来源钻瓜专利网。