[发明专利]一种邮件分类识别方法在审
申请号: | 201410547075.1 | 申请日: | 2014-10-14 |
公开(公告)号: | CN104361015A | 公开(公告)日: | 2015-02-18 |
发明(设计)人: | 罗阳;陈虹宇;王峻岭 | 申请(专利权)人: | 四川神琥科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 郭霞 |
地址: | 610041 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 邮件 分类 识别 方法 | ||
1.一种邮件分类识别方法,其特征在于,该方法包括以下步骤:
步骤1,获取用户收发邮件时的表情和/或语音特征数据;并按照所述表情和/或语音特征数据获得用户收发的邮件的分类属性,所述分类属性包括:正常邮件、垃圾邮件和无法确认;
如果所获得的分类属性为正常邮件或垃圾邮件,则结束分类,否则执行步骤2;
步骤2,依次使用多个分类器对邮件进行分类。
2.根据权利要求1所述的邮件分类识别方法,其特征在于,在步骤2之后还包括以下步骤:
步骤3,将每个分类器的分类结果发送至决策中心,在决策中心采用投票算法对所述多个分类器得到的分类结果进行投票,得到最终分类结果;
步骤4,对所述多个分类器进行增量更新,并用最终分类结果更新预设表情和/或语音特征数据库。
3.根据权利要求2所述的邮件分类识别方法,其特征在于,在步骤1后,且步骤2前包括:
对邮件进行分词、特征向量提取、权重计算预处理;
其中,所述特征向量提取包括:邮件头特征向量提取、附件特征向量提取、以及正文特征向量提取;并且
提取的特征向量以数据库字段的方式存入特征向量数据库。
4.根据权利要求3所述的邮件分类识别方法,其特征在于,所述分类器可采用基于决策树的学习算法构建。
5.根据权利要求4所述的邮件分类识别方法,其特征在于,对所述多个分类器进行增量更新包括:
每收发一封邮件,获取该邮件的特征向量;
判断所述特征向量是否位于已构建分类器的分类间隔内;
若在所述分类间隔内,将该邮件暂时存储;
当存储的邮件数目达到预先设定数值时,将存储的邮件的特征向量与已构建分类器的支持向量共同作为新的训练样本集,对已构建的分类器进行增量更新;
删除暂时存储的邮件。
6.根据权利要求5所述的邮件分类识别方法,其特征在于,所述多个分类器可包括:SVM分类器、KNN分类器和贝叶斯分类器。
7.根据权利要求1-6中任一项所述的邮件分类识别方法,其特征在于,
所述表情特征数据包括:眼睛位置信息、眼睛形状信息、眉毛位置信息、眉毛形状信息、嘴巴位置信息和嘴巴形状信息;
所述语音特征数据包括:声调信息、语速信息、以及过滤性关键词。
8.根据权利要求7所述的邮件分类识别方法,其特征在于,所述步骤1中按照所述表情和/或语音特征数据获得用户收发的邮件的分类属性包括:
从预设表情和/或语音特征数据库查找与所述表情和/或语音特征数据相匹配的预设表情和/或语音特征数据;
当查找出所述表情和/或语音特征数据与第一预设表情和/或语音特征数据相匹配时,确定所述表情和/或语音特征数据对应的表情和/或语音数据为第一表情和/或语音数据,并确定所述用户收发的邮件的类型为第一类型,其中,所述第一预设表情和/或语音特征数据为所述预设表情和/或语音特征数据库中的任一表情和/或语音特征数据,所述预设表情和/或语音特征数据库中还存储有表情和/或语音特征数据与邮件类型的对应关系;以及
当查找出所述表情和/或语音特征数据与第二预设表情和/或语音特征数据相匹配时,确定所述表情和/或语音特征数据对应的表情和/或语音数据为第二表情和/或语音数据,并确定所述用户收发的邮件的类型为第二类型,其中,所述第二预设表情和/或语音特征数据为所述预设表情和/或语音特征数据库中的任一表情和/或语音特征数据,并且所述第二预设表情和/或语音特征数据与所述第一预设表情和/或语音特征数据为不同的表情和/或语音特征数据。
9.根据权利要求8所述的邮件分类识别方法,其特征在于,
在确定所述用户收发的邮件的类型为第二类型之后,还包括:
比较所述第一表情和/或语音数据和所述第二表情和/或语音数据的优先级;
在比较出所述第一表情和/或语音数据的优先级高于所述第二表情和/或语音数据的优先级时,控制所述第一类型的邮件排列在所述第二类型的邮件之前;以及
在比较出所述第一表情和/或语音数据的优先级低于所述第二表情和/或语音数据的优先级时,控制所述第一类型的邮件排列在所述第二类型的邮件之后。
10.根据权利要求9所述的邮件分类识别方法,其特征在于,
在比较所述第一表情和/或语音数据和所述第二表情和/或语音数据的优先级之前,还包括:
接收所述用户的设定指令;以及
根据所述设定指令确定所述第一表情和/或语音数据和所述第二表情和/或语音数据的优先级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川神琥科技有限公司,未经四川神琥科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410547075.1/1.html,转载请声明来源钻瓜专利网。