[发明专利]一种基于封面的书籍类型深度学习分类方法在审
| 申请号: | 202110103351.5 | 申请日: | 2021-01-26 |
| 公开(公告)号: | CN112749682A | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 潘晓光;潘晓辉;王小华;张娜;董虎弟 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
| 地址: | 030006 山西省*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 封面 书籍 类型 深度 学习 分类 方法 | ||
1.一种基于封面的书籍类型深度学习分类方法,其特征在于,包括以下步骤:
S1、收集图书封面图像并制作训练数据集DTP;
S2、将训练数据集DTP输入深度学习模型并进行训练;
S3、使用S2所得到的深度学习模型对书籍进行分类。
2.根据权利要求1所述的一种基于封面的书籍类型深度学习分类方法,其特征在于:所述步骤S1中,操作步骤为:
S1a、收集大量图书封面图像,根据体裁进行将这些图像分为30个类别并进行标注;
S1b、将所有的图像调整到224×224的大小,得到图像数据DP;
S1c、使用视觉应用编程接口对数据集进行文本提取,得到文本数据DT;
S1d、将图像数据DP、文本数据DT和标注类别数据共同组成训练数据集DTP。
3.根据权利要求1所述的一种基于封面的书籍类型深度学习分类方法,其特征在于:所述步骤S2中,操作步骤为:
S2a、将训练数据集DTP中的图像数据DP输入基于视觉的深度学习网络;
S2b、将训练数据集DTP中的文本数据DT输入基于文本的深度学习网络;
S2c、将两个深度学习的输出进行直接拼接合并,得到全连接层;
S2d、将全连接层的数据直接输入softmax层进行分类;
S2e、使用梯度下降方法进行反向传播,更新网络参数;
S2f、训练结束后得到训练好的深度学习模型。
4.根据权利要求1所述的一种基于封面的书籍类型深度学习分类方法,其特征在于:所述步骤S3中,操作步骤为:
S3a、将封面图片调整到统一的尺寸224×224,得到图像数据xP;
S3b、使用谷歌云视觉应用编程接口对原始数据进行文本提取,得到文本数据xT;
S3c、将图像数据xP和文本数据xT输入S2所得到的训练好的模型中进行分类,得到待分类书籍的类别。
5.根据权利要求1所述的一种基于封面的书籍类型深度学习分类方法,其特征在于:所述步骤S2中,深度学习模型包括两个深度学习网络、一个全连接层和一个softmax分类器,其中基于视觉的深度学习网络使用残差神经网络模型,基于文本的深度学习网络使用通用句子编码器模型。
6.根据权利要求3所述的一种基于封面的书籍类型深度学习分类方法,其特征在于:所述步骤S2e中,梯度下降方法为:其中,θj为神经网络的参数,α为自行设置的学习率,J(θ)为误差函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110103351.5/1.html,转载请声明来源钻瓜专利网。





