本发明请求保护一种基于混沌粒子群优化CNN网络的中文垃圾邮件识别方法,首先使用分词器对中文垃圾邮件数据集进行分词、去停用词等预处理;其次采用Word2vec模型获取词向量,通过对词向量求和取平均值获得中文垃圾邮件的文本向量;然后在粒子群算法中引入混沌思想来训练卷积神经网络的网络参数;基于混沌粒子群优化卷积神经网络建立中文垃圾邮件分类模型;最后采用测试集通过所建立的模型实现垃圾邮件分类并计算分类正确率。本发明通过混沌粒子群优化算法寻优参数所建立的模型能够快速收敛,具有良好的鲁棒性和稳定性,同时能够提高中文垃圾邮件的分类识别率。
1.一种基于混沌粒子群优化CNN网络的中文垃圾邮件识别方法,其特征在于,包括以下步骤:步骤1:采用包括分词处理、去除停用词、过滤在内的步骤预处理中文垃圾邮件语料;步骤2:采用Word2vec对步骤1中处理好的语料进行训练,获取词向量及文本向量;步骤3:使用步骤2中获得的文本向量转化为卷积神经网络的输入向量,并搭建出卷积神经网络结构;步骤4:使用混沌粒子群优化卷积神经网络的网络参数;优化步骤主要在于:通过粒子群算法寻找卷积神经网络的卷积核、权值及阈值在内的参数,对获取的最优参数产生混沌序列,计算出混沌序列的适应度值,获得性能最好的可行解,并将其代替粒子群种群中随机选择出的一个粒子,通过误差函数来判断是否达到优化目标;步骤5:对步骤4中经参数优化的卷积神经网络模型进行性能测试,并计算出分类正确率。
本文链接:http://www.vipzhuanli.com/tech/sell/s_2312437.html,转载请声明来源钻瓜专利网。