[发明专利]一种基于特征提取的图书检索方法有效
申请号: | 201610459014.9 | 申请日: | 2016-06-23 |
公开(公告)号: | CN106126626B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 龙华;刘永召 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06K9/20;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于特征提取的图书检索方法,属于网络通信技术领域。本发明首先针对书库图书信息进行数据采集,提取图书标签信息,进行编码标识,建立图书信息库,存储图书信息;其次,依据图书标签信息元素进行图书聚类,对聚类后的书籍进行类别编码作为检索书籍的原始库源,并结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库;然后,提取用户访问图书落在聚类图书信息库中某类别的频次,建立用户访问模型,形成用户阅读模式标签,作为用户特征标签值;最后,建立匹配关联度模型,为匹配成功用户提供检索图书列表。本发明能够针对用户访问特征进行实时检索,能够精确的满足用户访问需求。 | ||
搜索关键词: | 一种 基于 特征 提取 图书 检索 方法 | ||
【主权项】:
1.一种基于特征提取的图书检索方法,其特征在于:首先针对书库图书信息进行数据采集,提取图书标签信息,进行编码标识,建立图书信息库,存储图书标签特征信息;其次,依据图书标签信息元素进行图书聚类,对聚类后的书籍进行类别编码作为检索书籍的原始库源,并结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库;然后,提取用户访问图书落在聚类图书信息库中某类别的频次,建立用户访问模型,形成用户阅读模式标签,作为用户特征标签值;最后,建立匹配关联度模型,为匹配成功用户提供检索图书列表;具体步骤为:Step1:建立图书信息库:对书库中图书信息进行数据采集,提取图书标签信息,包括图书名称、图书所属领域及图书出版信息,并对采集后的图书进行编码标识,按照【领域‑名称‑出版社‑出版日期】的形式进行存储,所有图书标签特征信息均按照编码依次放在图书信息中;Step2:建立聚类图书信息库:依据图书标签信息元素进行图书聚类,对聚类后的书籍进行类别编码作为检索书籍的原始库源,并结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库:Step2.1:书签聚类:1、首先,整合按照编码依次存储的图书书签信息,运用Spearman等级相关系数法建立图书标签定序信息之间的相关系数,定义该聚类参考系数的计算公式为:
其中,rs为Spearman的相关系数值,n是图书聚类原始值样本容量,di=(xi‑yi)表示图书标签样本xi和yi两个标签的是Minkowski距离;2、Spearman等级相关系数有‑1≤rs≤1,rs为正值时,存在正的等级相关,可以按照相关系数值聚成一大类,rs取负值时,存在负的等级相关,书签相关性差,分别聚为不同的小类,rs=1,表明两个变量的等级完全相同,存在完全相关,聚为一个小类,rs=‑1,表明两个变量的等级完全相反,存在完全的负相关,聚成不同的大类;3、将Spearman相关系数指标进行熵值求权,步骤如下:将指标数据构成矩阵Z,并对指标进行标准化处理,获得初始数据矩阵Z=(zij)m×n其中i=1,2,...,n;j=1,2,...,m,将矩阵元素归一化处理
取得标准化矩阵:Q=(qij)m×n;4、计算出图书标签特征值:评价矩阵Z中的第j类图书的信息熵为:
其中,分类信息效用价值为该信息熵Ej与1的差值,即:Dj=1‑Ej;Step2.2:确定分类图书的类别名称,作为更新编码,结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库,聚类图书信息存储方式为:【类别‑名称‑特征】;Step3:建立用户访问模型:提取用户访问图书落在聚类图书信息库中某类别的频次,形成用户阅读模式标签,作为用户特征标签值;Step3.1:用户访问频次:基于用户阅读图书的书目,整合访问次数建立用户访问图书类别频次,其中访问类A图书的频率计为:访问类A图书的次数/访问图书总次数,类B、类C等图书的频率计算公式可类比推出;Step3.2:用户阅读模式标签:提取用户访问频次计算结果,以某用户访问各类别图书的频率作为用户阅读标签的权重,按照频率大小进行排序,提取访问频率值作为用户特征标签,记录为:【类别‑频率;类别‑频率,……】;Step4:建立匹配关联度模型:将用户阅读模式标签的类别与提取到的聚类图书信息库中的图书标签类别信息进行逐次对比,按照访问类别的频率大小,依次排列出检索图书类比列表,在聚类图书列表中列举出图书的详细数目信息列表,作为检索图书提供给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610459014.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种新型口镜
- 下一篇:一种基于子空间的高光谱亚像元目标盲提取检测方法