[发明专利]分类模型的训练方法、分类方法、装置及设备在审
| 申请号: | 202011595164.5 | 申请日: | 2020-12-28 |
| 公开(公告)号: | CN112632351A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 王雅晴;窦德景 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q50/20 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类 模型 训练 方法 装置 设备 | ||
本申请公开了一种分类模型的训练方法、分类方法、装置及设备,涉及数据处理领域中的深度学习、人工智能技术。具体实现方案为:获取多个用户的行为信息,以及所述多个用户的个人基本信息;其中,所述多个用户中的至少部分用户的类别已知;将所述多个用户的个人基本信息输入待训练的分类模型中,得到所述多个用户的特征信息,以及已知类别的用户的预测类别;根据所述多个用户的行为信息、所述多个用户的特征信息、所述已知类别的用户的预测类别、以及所述已知类别的用户的真实类别,对所述待训练的分类模型进行训练,得到训练后的分类模型。利用分类模型确定出的用户类别更加准确。
技术领域
本申请涉及数据处理领域中的深度学习、人工智能技术,尤其涉及一种分类模型的训练方法、分类方法、装置及设备。
背景技术
在多种应用场景中,需要对用户进行分类。例如,在教学场景中,教师需要识别学生的成绩类别,以便根据成绩类别对学生进行针对性的指导。再例如,在信息推荐场景中,需要识别用户的兴趣类别,以便根据兴趣类别对用户进行个性化的信息推荐。
现有技术中,一般会预先设置不同用户类别对应的识别规则。一个类别对应的识别规则中定义了属于该类别的用户具有的特征。在对用户进行分类时,先提取该用户的特征,然后将提取到的特征与识别规则进行匹配,从而确定出用户所属的类别。
然而,上述的识别规则一般是相关人员对各种类型的用户进行分析生成的,这样可能由于工作人员的经验或者主观因素的影响,导致识别规则准确性较低,进而采用这些识别规则对用户进行分类,分类结果的准确性较低。
发明内容
本申请提供了一种分类模型的训练方法、分类方法、装置及设备。
根据本申请的第一方面,提供了一种分类模型的训练方法,包括:
获取多个用户的行为信息,以及所述多个用户的个人基本信息;其中,所述多个用户中的至少部分用户的类别已知;
将所述多个用户的个人基本信息输入待训练的分类模型中,得到所述多个用户的特征信息,以及已知类别的用户的预测类别;
根据所述多个用户的行为信息、所述多个用户的特征信息、所述已知类别的用户的预测类别、以及所述已知类别的用户的真实类别,对所述待训练的分类模型进行训练,得到训练后的分类模型。
根据本申请的第二方面,提供了一种分类方法,包括:
获取未知类别的用户的特征信息;
将所述未知类别的用户的特征信息输入已训练的分类模型,根据所述分类模型的输出,确定所述未知类别的用户的预测类别;
其中,所述已训练的分类模型是根据多个用户的行为信息、所述多个用户的个人基本信息、以及已知类别的用户的真实类别训练得到的;所述多个用户包括所述已知类别的用户和所述未知类别的用户,所述未知类别的用户的特征信息是在所述分类模型的训练过程中学习得到的,所述分类模型采用第一方面任一项所述的方法训练得到。
根据本申请的第三方面,提供了一种分类模型的训练装置,包括:
获取模块,用于获取多个用户的行为信息,以及所述多个用户的个人基本信息;其中,所述多个用户中的至少部分用户的类别已知;
训练模块,用于将所述多个用户的个人基本信息输入待训练的分类模型中,得到所述多个用户的特征信息,以及已知类别的用户的预测类别;
所述训练模块,还用于根据所述多个用户的行为信息、所述多个用户的特征信息、所述已知类别的用户的预测类别、以及所述已知类别的用户的真实类别,对所述待训练的分类模型进行训练,得到训练后的分类模型。
根据本申请的第四方面,提供了一种分类装置,包括:
获取模块,用于获取未知类别的用户的特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011595164.5/2.html,转载请声明来源钻瓜专利网。





