[发明专利]分类模型训练方法及装置有效

申请号：	201510917223.9	申请日：	2015-12-10
公开（公告）号：	CN105574538B	公开（公告）日：	2020-03-17
发明（设计）人：	汪平仄;张涛;侯文迪	申请（专利权）人：	小米科技有限责任公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06Q10/10
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	鞠永善
地址：	100085 北京市海淀区清***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分类模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种分类模型训练方法及装置，属于信息技术领域。方法包括：根据多个样本邮件中每个样本邮件的至少一项特征集合，获取每个样本邮件的特征向量，根据样本邮件的历史分类记录，确定每个样本邮件对应的类别标识，根据每个样本邮件的特征向量以及类别标识进行训练，得到第一分类模型。通过根据每个样本邮件的至少一项特征集合，确定特征向量，并根据样本邮件的历史分类记录，确定每个样本邮件的类别标识，从而根据每个样本邮件的特征向量和类别标识进行训练，得到第一分类模型。通过训练得到分类模型，在对邮件进行分类时能够根据用户的分类习惯进行分类，提高了邮件分类的准确率，减少了邮件分类错误的问题，达到了准确分类邮件的效果。

技术领域

本公开涉及信息技术领域，尤其涉及一种分类模型训练方法及装置。

背景技术

随着社交圈的规模越来越大，用户在工作或生活中经常会收到很多邮件，如会议邮件、广告邮件等。为了便于进行管理，通常需要对邮件进行分类。

分类时，用户会先创建多个邮件文件夹，并设置好邮件分类规则，即每个邮件文件夹所对应的邮件特征集合。每当接收到一个邮件时，分析邮件的内容来获取该邮件的特征集合，根据设置好的邮件分类规则，确定与该邮件的特征集合匹配的邮件文件夹，并将该邮件存储于匹配的邮件文件夹中，从而实现对该邮件的分类。

发明内容

为克服相关技术中存在的问题，本公开提供一种分类模型训练方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种分类模型训练方法，所述方法包括：

根据多个样本邮件中每个样本邮件的至少一项特征集合，获取每个样本邮件的特征向量；

根据样本邮件的历史分类记录，确定每个样本邮件对应的类别标识；

根据每个样本邮件的特征向量以及类别标识进行训练，得到第一分类模型。

在另一实施例中，所述根据每个样本邮件的特征向量以及类别标识进行训练，得到第一分类模型，包括：