[发明专利]基于显隐性潜在因子模型的电视产品精准推荐方法及系统有效
| 申请号: | 201910085589.2 | 申请日: | 2019-01-29 |
| 公开(公告)号: | CN109963175B | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 奚琪;桂智杰;李创;项永明;杨萍 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
| 主分类号: | H04N21/258 | 分类号: | H04N21/258;H04N21/25;H04N21/845;H04N21/81;H04L29/08;G06K9/62 |
| 代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈勇 |
| 地址: | 450000 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 隐性 潜在 因子 模型 电视 产品 精准 推荐 方法 系统 | ||
1.一种基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,包括以下步骤:
步骤1:电视产品正题名通过正则表达式进行处理,综合考虑多种反爬虫机制,设计爬虫策略,对所需的外部数据进行爬取;
步骤2:根据电视产品和用户人群的不同特征,分别建立针对电视产品和用户人群的分类模型,通过所述分类模型实现对电视产品信息和用户信息的自动标签标注,得到标注标签后的电视产品信息和标注标签后的用户信息;
步骤3:依据标注标签后的电视产品信息和标注标签后的用户信息及爬取的外部数据得出显性潜在因子,所述显性潜在因子包括电视产品显性潜在因子和用户显性潜在因子,通过显性潜在因子得出隐性潜在因子,基于显性潜在因子及隐性潜在因子构建显隐性潜在因子模型;
所述步骤3包括:
步骤3.1:依据标注标签后的电视产品信息和爬取的外部数据得出电视产品显性潜在因子,所述电视产品显性潜在因子包括电视产品适用人群、电视产品静态参数及电视产品类别信息,所述电视产品静态参数包括电视产品的导演、演员、出品年代、声道语种和地区参数;
步骤3.2:依据标注标签后的用户信息和爬取的外部数据得出用户显性潜在因子,所述用户显性潜在因子包括用户家庭成员、用户浏览特征及用户收视偏好;
步骤3.3:将除电视产品显性潜在因子和用户显性潜在因子以外的电视产品和用户人群的特征定义为隐性潜在因子;
步骤3.4:对所述隐性潜在因子进行求解:
设隐性潜在因子有n维,显性潜在因子为m维,其中n为未知维数,m为已知的显性潜在因子维数,则总的潜在因子空间维度为f=m+n,基于传统潜在因子模型,在确定显性潜在因子的条件下,训练出n维未知的隐性潜在因子;
步骤3.5:将电视产品显性潜在因子、用户显性潜在因子及隐性潜在因子共同构成显隐性潜在因子矩阵,所述显隐性潜在因子矩阵包括用户显隐性潜在因子矩阵P和电视产品显隐性潜在因子矩阵Q,通过如下方式计算P和Q:
定义损失函数:
其中,L是损失函数;pi是用户i的显隐性潜在因子向量,qj是电视产品j的显隐性潜在因子向量;si,j是用户i对电视产品j的评分;λ为惩罚因子;
在损失函数中加入基准偏置项:
bi,j=μ+bi+bj
其中,μ表示所有用户对电视产品打分的平均值,bi和bj分别表示用户i和电视产品j的基准偏置,将上述基准偏置项加入到原损失函数的表达式中可得如下目标函数表达式:
分别对上式的bi、bj、pi和qj求偏导,通过随机梯度下降法求解参数bi、bj、pi和qj,根据随机梯度下降法,在训练的过程中,各个参数都做如下更新:
其中,γ为学习步长;
步骤3.6:通过步骤3.1-步骤3.5完成显隐性潜在因子模型的构建;
步骤4:基于构建的显隐性潜在因子模型进行电视产品的推荐。
2.根据权利要求1所述的基于显隐性潜在因子模型的电视产品精准推荐方法,其特征在于,所述步骤1包括:
步骤1.1:设计反爬虫机制,所述反爬虫机制包括采用模拟Ajax请求的方式,主动发起异步请求获取所需数据;
步骤1.2:根据反爬虫机制设计网络爬虫算法,对网页数据进行爬取:
采取所述反爬虫机制不断发起Http请求,然后接收Http回应,解析得到的HTML文件,如果是确定的结构,直接匹配得到标签中的数据;
如果结构为非确定的,则对整个DOM树进行遍历搜索,获取标签中的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910085589.2/1.html,转载请声明来源钻瓜专利网。





