[发明专利]一种基于分类器动态更新的垃圾邮件检测方法及系统无效
| 申请号: | 200810116913.4 | 申请日: | 2008-07-18 |
| 公开(公告)号: | CN101316246A | 公开(公告)日: | 2008-12-03 |
| 发明(设计)人: | 谭营;阮光尘 | 申请(专利权)人: | 北京大学 |
| 主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L12/26 |
| 代理公司: | 北京路浩知识产权代理有限公司 | 代理人: | 王朋飞 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于分类器动态更新的垃圾邮件检测方法及系统,包括步骤:构建由分类向量构成的分类器;获取待检测邮件的特征向量与每个分类向量的相似度;由相似度最高的分类向量作出分类;获取用户反馈的待检测邮件的分类;统计每个分类向量作出正确分类的次数;接收新的待测邮件后按上述步骤分类,当达到设定条件时更新分类器,正确分类次数超过设定值的分类向量被保留,对新接收的待检测邮件作出分类;该系统包括分类器更新单元,在达到设定条件时更新分类器,将正确分类次数超过设定值的分类向量保留并用于参与以后的邮件分类。本发明将分类器中分类效果好的分类向量保留一段时间,保证了分类的准确性,不会受到新数据流的局限性的影响。 | ||
| 搜索关键词: | 一种 基于 分类 动态 更新 垃圾邮件 检测 方法 系统 | ||
【主权项】:
1、一种基于分类器动态更新的垃圾邮件检测方法,其特征在于,包括步骤:s101,构建由分类向量构成的分类器;s102,获取待检测邮件的特征向量与每个分类向量的相似度,由相似度最高的分类向量作出对所述待检测邮件的分类;s103,获取用户反馈的所述待检测邮件的分类,统计每个分类向量作出正确分类的次数;s104,重复步骤s102~s103,在步骤s102中,还由正确分类次数超过设定值的分类向量作出对所述待检测邮件的分类;s105,达到设定条件时更新所述分类器,正确分类次数超过设定值的分类向量被保留;s106,重复步骤s102~s105,在步骤s102中,还由被保留的分类向量作出所述对待检测邮件的分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810116913.4/,转载请声明来源钻瓜专利网。





