[发明专利]基于受限玻尔兹曼机驱动的交互式个性化搜索方法有效
申请号: | 202010216557.4 | 申请日: | 2020-03-25 |
公开(公告)号: | CN111339428B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 暴琳;张贞凯;王敏;马国军;邓小乔 | 申请(专利权)人: | 江苏科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 常虹 |
地址: | 212003*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 受限 玻尔兹曼机 驱动 交互式 个性化 搜索 方法 | ||
本发明公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法,包括:1、获取用户u的历史评价数据,包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;2、将评分大于预设评分阈值的项目组成优势项目集合Du,并构建样本集;3、构建基于RBM的用户偏好特征提取模型;4、构建用户偏好概率模型;5、生成N个新项目并设置类别标签;6、在搜索空间中选取与N个新项目类别标签向量相似度最高的N个项目,构成待推荐项目集合Su;7、计算Su中每个项目的适应值;8、选择Su中适应值最大的前TOPN个项目作为搜索结果。该方法能够有效引导用户进行个性化搜索的方向,尽快帮助用户搜索到用户满意解,从而提高个性化搜索算法的综合性能。
技术领域
本发明属于数据挖掘技术领域,具体涉及一种交互式个性化搜索方法。
背景技术
随着大数据、云计算等技术的迅猛发展,信息呈现爆炸式增长,各类互联网应用中聚集了大量用户生成内容,给用户带来新信息的同时,也增加了用户筛选有效信息并最终做出决策的难度。个性化搜索作为连接用户与信息的桥梁,能够引导用户进行快速搜索,尽可能帮助用户从海量信息中快速筛选出与用户兴趣相符的内容,有效缓解信息过载。
用户生成内容中包含来自诸多用户提供的信息,包括用户行为数据、用户信息、项目信息等,这些多源异构数据从不同角度反映了用户的兴趣偏好,充分利用这些信息,可有效提高个性化搜索的质量。由于用户生成内容具有的数据稀疏性、不完整性、动态性等复杂特性,因此,处理融合多源异构用户生成内容数据的个性化搜索问题得难度更大。交互式进化计算有效利用用户对优化问题的主观评价和决策,将人类智能评价信息与传统进化优化算法相结合,是解决融合多源异构数据个性化搜索问题的有效途径。
申请号为201410202346.X的中国专利公开了一种用于心理学图书个性化快速搜索的交互式进化优化方法,指导用户快速寻找满意图书,该方法利用用户的搜索记录和群体共性搜索信息来建立用户偏好模型,没有充分挖掘用户历史数据中隐含的偏好特征。申请号为201910151051.7的中国专利公开了一种个性化商品推荐方法,该方法根据对用户的分类来进行商品推荐,只能体现出不同类用户之间的个性差别,而无法体现具体用户的个性化。申请号为201910431441.X的中国专利公开了一种基于交互数据聚类的个性化推荐方法及系统,其中的个性化推荐方法通过对用户聚类,得到相似用户的兴趣点,从而对用户进行个性化推荐,同样体现的是同类用户的偏好。
发明内容
发明目的:针对现有技术中存在的问题,本发明公开了一种基于受限玻尔兹曼机驱动的交互式个性化搜索方法,该方法能够引导当前用户进行个性化搜索。
技术方案:本发明采用如下技术方案:
基于受限玻尔兹曼机驱动的交互式个性化搜索方法,包括:
(1)获取用户u的历史评价数据,所述历史评价数据包括用户u已评价的所有项目、对每个项目的评分和评价文本,并将评价文本进行向量化;
(2)将评分大于预设评分阈值的项目组成优势项目集合Du,构成样本集其中xi∈Du,为项目xi的类别标签向量,长度为类别总数n1;为用户u对项目xi的评价文本向量化表示,长度为n2;i=1,2,…,|Du|,|Du|表示Du中的项目数目;
(3)构建基于RBM的用户偏好特征提取模型,所述用户偏好特征提取模型用于根据优势项目集合Du提取用户的偏好特征;
(4)构建用户偏好概率模型,所述用户偏好概率模型用于表示用户对每个类别项目的偏好概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010216557.4/2.html,转载请声明来源钻瓜专利网。