[发明专利]一种分类模型的训练方法和装置在审
| 申请号: | 201810765795.3 | 申请日: | 2018-07-12 |
| 公开(公告)号: | CN109214412A | 公开(公告)日: | 2019-01-15 |
| 发明(设计)人: | 张志伟;吴丽军;赵伟阳 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类模型 文本特征 评论数据 图像特征数据 方法和装置 特征数据 图像数据 获取图像数据 分类结果 数据获得 数据应用 融合 拼接 图像 | ||
本发明实施例提供了一种分类模型的训练方法和装置,所述方法包括:获取图像数据;根据所述图像数据获得图像特征数据;获取用户与图像之间的评论数据;根据所述评论数据获得文本特征数据;拼接所述图像特征数据和所述文本特征数据获得融合特征数据;采用所述融合特征数据训练指定分类模型。本发明实施例将文本特征数据应用到指定分类模型中,由于文本特征数据会随着用户与图像数据之间评论数据越来越多,从而使得分类模型的分类结果变得越加准确。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种分类模型的训练方法、一种分类模型的训练装置以及一个或多个机器可读介质。
背景技术
图像分类是根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。
近年来,深度学习在视频图像、语音识别、自然语言处理等相关领域获得了广泛应用。卷积神经网络(CNN,Convolutional Neural Network)作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得图像分类任务在应用卷积神经网络之后,预测精度大幅提升。
在使用卷积神经网络模型对未知数据进行预测时,一般采用的方式为:
(1)根据已知的数据集,离线训练一个分类模型;
(1)加载预先训练好的模型参数,对未知数据进行预测。
这种方式是静态地对数据进行预测,利用的信息仅有图像或者其它的多媒体数据信息,所以这种方式存在下面两个缺点:
(1)无论采用何种训练算法,采用何种网络结构,数据规模限制着基于卷积神经网络模型的精度上限;
(2)卷积神经网络模型是静态的,不会随着时间的推移变得原来越准,相反的往往会在模型运行一定时间之后出现模型退化的情况。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种分类模型的训练方法、一种分类模型的训练装置以及一个或多个机器可读介质。
为了解决上述问题,本发明实施例公开了一种分类模型的训练方法,包括:
获取图像数据;
根据所述图像数据获得图像特征数据;
获取用户对图像的评论数据;
根据所述评论数据获得文本特征数据;
拼接所述图像特征数据和所述文本特征数据获得融合特征数据;
采用所述融合特征数据训练指定分类模型。
优选地,所述根据所述图像数据获得图像特征数据,包括:
采用所述图像数据训练图像分类模型;
采用所述训练后的图像分类模型从所述图像数据中提取图像特征数据。
优选地,所述采用所述训练后的图像分类模型从所述图形训练数据中提取图像特征数据,包括:
将所述图像数据输入到训练后的图像分类模型,获得网络层的特征数据;
从所述网络层特征数据中选取最后两层的特征数据作为图像特征数据;所述图像特征数据包括语义特征数据和类别特征数据。
优选地,所述根据所述评论数据获得文本特征数据,包括:
获取所述用户对图像数据的评论数据;
对所述评论数据进行分词操作得到分词集合;
去除所述分词集合中停用词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810765795.3/2.html,转载请声明来源钻瓜专利网。





