[发明专利]一种图书馆图书自动分类方法在审
| 申请号: | 201811520226.9 | 申请日: | 2018-12-12 |
| 公开(公告)号: | CN109657750A | 公开(公告)日: | 2019-04-19 |
| 发明(设计)人: | 林聪 | 申请(专利权)人: | 枣庄学院 |
| 主分类号: | G06K17/00 | 分类号: | G06K17/00;G06K9/00;G06K9/62;G06F17/27 |
| 代理公司: | 长沙新裕知识产权代理有限公司 43210 | 代理人: | 周跃仁 |
| 地址: | 277160 *** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征数据库 图像信息 自动分类 分类 图书馆 成熟模型 分类信息 快速自动 人力物力 图书封面 放入 信息管理 匹配 输出 携带 | ||
本发明涉及信息管理领域,具体涉及一种图书馆图书自动分类方法。包括:步骤一、确定成熟模型,将数据放入特征数据库;步骤二:获取待分类图书封面的文字;步骤三:得到待分类得到图像信息;步骤四:与特征数据库进行匹配;步骤五:根据图像信息中携带的信息,输出图书的分类信息。本发明实现了快速自动对待测图书进行相应分类的效果,同时该方法操作方便,有效的节省成本和人力物力。
技术领域
本发明涉及信息管理领域,具体涉及一种图书馆图书自动分类方法。
背景技术
基于电子科技技术的发展和推广,数字化办公已越来越受到用户的青睐,相对于传统的纸质化办公,数字化办公具有效率高、易管理和环保等优势。而基于长久的数字化办公,在阅读方面,人们也越来越倾向于网络的推荐和检索。
在大众阅读的良好环境下,各地区也相应建设了如图书馆等供公众借阅图书的场所,而在建设该类场所的同时,因考虑到需要存入大量的图书,这就需要大量的工作量以对图书进行相应的归类和存放,即同种类别的图书需要放入相应的书柜中,以便查阅。
而对于如何将图书进行分类,在传统方式中,为人工分类,或者人工借助扫码设备对图书进行分类。在一方面,条形码也仅能显示图书在专业上的分类,对于其他分类信息是无法得知的。因此,通过扫描也仅能实现在专业上的分类。该种分类方式下,需要该图书的信息已写入扫码数据库,进一步的,还需要该图书已登记有条形码。因此,该种分类方式存在效率不高和分类信息不丰富的缺陷,对于受众在选择上,无法提供相应的参考信息。
发明内容
为了解决上述问题,本发明提供了一种图书馆图书自动分类方法。
本发明的具体技术方案为:一种图书馆图书自动分类方法,包括:
步骤一、确定成熟模型,将数据放入特征数据库;
步骤二:获取待分类图书封面的文字;
步骤三:得到待分类得到图像信息;
步骤四:与特征数据库进行匹配;
步骤五:根据图像信息中携带的信息,输出图书的分类信息。
优选的,所述步骤一具体为:读取所有图书的名称及对应书架并将图书名称转化为汉字,通过汉语语言模型结合用来产生词向量的相关模型或信息检索数据挖掘的常用加权技术进行分词形成特征向量,其中,n为大于等于1的正整数,根据书架所属的图书种类个数确定分类个数;
将已有图书的特征向量及对应的书架号分为3块,比例分别为7∶1.5∶1.5,其中70%用于训练模型15%用于测试训练精度并不断调整模型已使测试精度达到最高,剩余的15%用于实际测量精度;此时,通过模型库中的模型对70%的图书数据图书特征向量进行分类,得出训练模型并使用15%的数据作为测试数据对模型进行评测,得到精度最高的模型,并用剩余15%的数据进行实测,选择此时精度最高的模型作为成熟模型,放入特征数据库。
优选的,所述步骤二具体为:通过拍摄方式获取待分类图书封面的文字。
优选的,所述步骤二具体为:通过扫描方式获取待分类图书封面的文字。
优选的,所述封面文字按照行划分,具体为:将图书封面的文字按照在图书封面上文字排版划分为多行。
优选的,所述步骤三具体为:利用训练好的成熟模型检测拍摄到的待分类图书封面的文字,若未检测到拍摄到的待分类图书封面的文字,则系统处于等待状态,若检测到拍摄到的待分类图书封面的文字,系对图书进行匹配。
优选的,所述步骤三具体为:利用训练好的成熟模型检测扫描到的待分类图书封面的文字,若未检测到扫描到的待分类图书封面的文字,则系统处于等待状态,若检测到扫描到的待分类图书封面的文字,系对图书进行匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于枣庄学院,未经枣庄学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811520226.9/2.html,转载请声明来源钻瓜专利网。





