[发明专利]一种基于工业4.0物联网的人工智能分类方法在审
申请号: | 202111163939.6 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113947137A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 王祎明 | 申请(专利权)人: | 王祎明 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京汇捷知识产权代理事务所(普通合伙) 11531 | 代理人: | 盛君梅 |
地址: | 361000 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 工业 4.0 联网 人工智能 分类 方法 | ||
1.一种基于工业4.0物联网的人工智能分类方法,其特征在于,该方法从传入流量中过滤不需要的电子邮件,然后将其分类为垃圾邮件和基于工业4.0的物联网IoTs系统的网络钓鱼,AI机制收集和分析电子邮件,以检测识别分类模式的多个特征,将输入的数据分为多个批次,每个批次都根据从前一批次分类中获得的知识进行分类。
2.如权利要求1所述的一种基于工业4.0物联网的人工智能分类方法,其特征在于,将传入流量划分为合法和可疑电子邮件,传入的电子邮件流量分为若干批;
(a)对于每个批次,从传入的电子邮件中提取特征,并为每个实例(电子邮件)创建特征向量;
(b)使用分层聚类算法对电子邮件进行聚类;
(c)该分类器使用聚类后得到的标签作为训练数据,并给出了两个类,即ham和spam。
3.如权利要求2所述的一种基于工业4.0物联网的人工智能分类方法,其特征在于,一旦有了这个分类,ham电子邮件将被分离,垃圾邮件将用于下一个分类阶段;
(A)进一步从垃圾邮件中过滤出网络钓鱼邮件;
(B)对于方法的第二层,选择最可行的特征来检测钓鱼电子邮件;
(C)这一层也遵循与垃圾邮件和火腿分类相同的程序;
(D)一旦垃圾邮件和钓鱼邮件在集群中分离,分类器使用这些集群输出创建垃圾邮件和钓鱼类;
(E)下一批进料的分类还包括前一批的结果,以提高准确性,对于所有阶段,流程的其余部分都是类似的。
4.如权利要求3所述的一种基于工业4.0物联网的人工智能分类方法,其特征在于,特征选择,电子邮件分类功能,用于垃圾邮件和火腿的分类,以及垃圾邮件和钓鱼电子邮件的分类;
基于正文的功能:这些功能取自电子邮件正文,包括HTML或表单的存在、电子邮件正文中字符和单词的总数等;
基于主题的功能:这些功能基于电子邮件主;
基于脚本的功能:这些功能基于电子邮件中脚本的使用,包括电子邮件中是否存在脚本,电子邮件是否包含弹出窗口等;
基于URL的功能:这些功能基于HTML电子邮件中的锚定标记;
基于发件人的功能:这些功能基于发件人的详细信息。
5.如权利要求4所述的一种基于工业4.0物联网的人工智能分类方法,特征在于,可疑和合法电子邮件的分类,将传入流量分为可疑(垃圾邮件和网络钓鱼)和合法电子邮件,传入电子邮件流量分为多个批次,每个批次的第一步是从传入电子邮件中提取特征,使用分层聚类方法对电子邮件进行聚类,该分类器使用聚类后得到的标签作为训练数据,并给出了两个类,即ham和spam。
6.如权利要求5所述的一种基于工业4.0物联网的人工智能分类方法,特征在于,网络钓鱼检测,有了这个分类,ham邮件将被分离,垃圾邮件将被用于下一个分类阶段,知道钓鱼通常是垃圾邮件的一个子集,进一步从垃圾邮件中过滤出网络钓鱼邮件,对于方法的第二层,再次是为钓鱼电子邮件检测选择最可行的特征,这一层也遵循与垃圾邮件和火腿分类相同的程序,一旦垃圾邮件和网络钓鱼邮件使用分层聚类在集群中分离,分类器将使用这些集群输出创建垃圾邮件和网络钓鱼类。
7.如权利要求6所述的一种基于工业4.0物联网的人工智能分类方法,特征在于,使用分层聚类算法进行聚类,在这一阶段,使用分层聚类方法,将实例聚类成树形;最初,当没有可用于训练的标记数据时,要求用户标记来自第一批的电子邮件,在第一批电子邮件上可以训练聚类算法,其余的电子邮件是根据这些训练数据进行分类的,在每个批次结束时,在每个批次结束时使用一个分类器对集群实例进行分类,这根据它对其训练的实例的预测能力进行评估的;对于下一批邮件,不做任何标记,从前一批邮件中获得的知识用于对邮件进行分类;该树由引入的代表点构造而成,增强搜索结果的相关性;此外,该方法还确定处理过程中的簇数。
8.如权利要求7所述的一种基于工业4.0物联网的人工智能分类方法,特征在于,分类算法,在每个批次结束时,使用一个分类器,该分类器使用前一批次进行训练,对于第一批,使用聚类算法的输出进行训练;对于这两个阶段,测试许多分类器,垃圾邮件检测阶段使用分类算法(即SMO和过滤关联)进行测试;在评估中,将对这些量词进行比较分析;在网络钓鱼检测阶段,使用MLP和随机森林进行测试;
在每一批的末尾,使用一个分类器来使用前一批进行训练,对于第一批,使用聚类算法的输出进行训练,对于这两个阶段,测试几个分类器,垃圾邮件检测阶段使用四种分类算法进行了测试,它们是:NalveBayes、SMO、随机森林。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王祎明,未经王祎明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111163939.6/1.html,转载请声明来源钻瓜专利网。