[发明专利]一种基于特征提取的图书检索方法有效

专利信息
申请号: 201610459014.9 申请日: 2016-06-23
公开(公告)号: CN106126626B 公开(公告)日: 2019-06-11
发明(设计)人: 龙华;刘永召 申请(专利权)人: 昆明理工大学
主分类号: G06F16/242 分类号: G06F16/242;G06K9/20;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 650093 云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于特征提取的图书检索方法,属于网络通信技术领域。本发明首先针对书库图书信息进行数据采集,提取图书标签信息,进行编码标识,建立图书信息库,存储图书信息;其次,依据图书标签信息元素进行图书聚类,对聚类后的书籍进行类别编码作为检索书籍的原始库源,并结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库;然后,提取用户访问图书落在聚类图书信息库中某类别的频次,建立用户访问模型,形成用户阅读模式标签,作为用户特征标签值;最后,建立匹配关联度模型,为匹配成功用户提供检索图书列表。本发明能够针对用户访问特征进行实时检索,能够精确的满足用户访问需求。
搜索关键词: 一种 基于 特征 提取 图书 检索 方法
【主权项】:
1.一种基于特征提取的图书检索方法,其特征在于:首先针对书库图书信息进行数据采集,提取图书标签信息,进行编码标识,建立图书信息库,存储图书标签特征信息;其次,依据图书标签信息元素进行图书聚类,对聚类后的书籍进行类别编码作为检索书籍的原始库源,并结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库;然后,提取用户访问图书落在聚类图书信息库中某类别的频次,建立用户访问模型,形成用户阅读模式标签,作为用户特征标签值;最后,建立匹配关联度模型,为匹配成功用户提供检索图书列表;具体步骤为:Step1:建立图书信息库:对书库中图书信息进行数据采集,提取图书标签信息,包括图书名称、图书所属领域及图书出版信息,并对采集后的图书进行编码标识,按照【领域‑名称‑出版社‑出版日期】的形式进行存储,所有图书标签特征信息均按照编码依次放在图书信息中;Step2:建立聚类图书信息库:依据图书标签信息元素进行图书聚类,对聚类后的书籍进行类别编码作为检索书籍的原始库源,并结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库:Step2.1:书签聚类:1、首先,整合按照编码依次存储的图书书签信息,运用Spearman等级相关系数法建立图书标签定序信息之间的相关系数,定义该聚类参考系数的计算公式为:其中,rs为Spearman的相关系数值,n是图书聚类原始值样本容量,di=(xi‑yi)表示图书标签样本xi和yi两个标签的是Minkowski距离;2、Spearman等级相关系数有‑1≤rs≤1,rs为正值时,存在正的等级相关,可以按照相关系数值聚成一大类,rs取负值时,存在负的等级相关,书签相关性差,分别聚为不同的小类,rs=1,表明两个变量的等级完全相同,存在完全相关,聚为一个小类,rs=‑1,表明两个变量的等级完全相反,存在完全的负相关,聚成不同的大类;3、将Spearman相关系数指标进行熵值求权,步骤如下:将指标数据构成矩阵Z,并对指标进行标准化处理,获得初始数据矩阵Z=(zij)m×n其中i=1,2,...,n;j=1,2,...,m,将矩阵元素归一化处理取得标准化矩阵:Q=(qij)m×n;4、计算出图书标签特征值:评价矩阵Z中的第j类图书的信息熵为:其中,分类信息效用价值为该信息熵Ej与1的差值,即:Dj=1‑Ej;Step2.2:确定分类图书的类别名称,作为更新编码,结合图书原始标签进行图书特征重组,提取各类别图书的新的特征词组,作为聚类图书信息库,聚类图书信息存储方式为:【类别‑名称‑特征】;Step3:建立用户访问模型:提取用户访问图书落在聚类图书信息库中某类别的频次,形成用户阅读模式标签,作为用户特征标签值;Step3.1:用户访问频次:基于用户阅读图书的书目,整合访问次数建立用户访问图书类别频次,其中访问类A图书的频率计为:访问类A图书的次数/访问图书总次数,类B、类C等图书的频率计算公式可类比推出;Step3.2:用户阅读模式标签:提取用户访问频次计算结果,以某用户访问各类别图书的频率作为用户阅读标签的权重,按照频率大小进行排序,提取访问频率值作为用户特征标签,记录为:【类别‑频率;类别‑频率,……】;Step4:建立匹配关联度模型:将用户阅读模式标签的类别与提取到的聚类图书信息库中的图书标签类别信息进行逐次对比,按照访问类别的频率大小,依次排列出检索图书类比列表,在聚类图书列表中列举出图书的详细数目信息列表,作为检索图书提供给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610459014.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top