[发明专利]一种基于标签权重算法的用户对商品关注度的确定方法在审
申请号: | 201810147461.X | 申请日: | 2018-02-12 |
公开(公告)号: | CN108230051A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 胡国龙 | 申请(专利权)人: | 昆山数泰数据技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215300 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关注度 权重 标签 公式计算 权重算法 原始数据 分组 网址 笔记本电脑 人工智能 商业智能 时间排序 时间衰减 数据挖掘 用户浏览 大数据 手机 排序 分类 电信 汽车 | ||
1.一种基于标签权重算法的用户对商品关注度的确定方法,其特征在于:
获取电信、电商等用户原始数据;原始数据需要按照用户进行分组,再按照用户浏览的商品(如手机、笔记本电脑、汽车、房产等)进行分类;数据按照商品型号分组、时间排序、网址、次数分组;按照标签权重公式计算,计算用户对某种商品的关注度;标签权重=时间衰减因子×网址子权重×次数权重;根据标签权重公式计算各商品型号的关注度;最后按照关注度(标签权重)排序,确定用户对某商品型号的关注度。
2.根据权利1所述的一种基于标签权重算法的用户对商品关注度的确定方法,其特征在于,所述商品包括:手机、电脑、汽车、房产、教育服务等商品,商品包括这些,但不限于这些商品,这里不一一列举。
3.根据权利1所述的电信、电商等积累的线上用户原始数据包括:
电信、电商的用户每天生产的海量数据,主要包括用户的网上行为等数据,由用户唯一识别号ID、用户的浏览内容、用户点击的时间戳ts、用户点击的url、用户特征UseAgent等组成。
4.根据权利1所述的按照用户进行分组包括:
对海量的数据按用户分组,原始数据需要按照用户进行分组,按照用户浏览的商品(如手机、笔记本电脑、汽车、房产等)进行分类;比如:研究用户对手机的关注度的时候,我们只提取出手机相关数据,这样可以减少数据计算量。
5.根据权利1所述的数据按照商品型号分组、时间排序、网址、次数分组包括:
按照商品型号分组,如:手机有很多种品牌,有华为、中兴、小米、OPPO、VIVO等;每种品牌有很多种型号,如华为有荣耀8、HUAWEI nova、畅享7、Mate 10,有的价格1000元左右,有的价格超过4000元;用户可能对华为1000元左右的荣耀8感兴趣,对华为高价格手机Mate10不敢兴趣;再按照时间排序,根据标签权重算法,根据浏览时间的远近设置不同的权重。
6.根据权利1所述的按照标签权重公式计算,计算用户对某种商品的关注度包括:
标签权重=时间衰减因子×网址子权重×次数权重;时间衰减因子——时间越近,权重越高;如现在是2017.12.31日,最近一个星期2017.12.24~2017.12.30的权重为1,往前一个星期2017.12.17~2017.12.23的权重为0.667,再前一个星期2017.12.10~2017.12.16的权重为0.444,再前一个星期2017.12.03~2017.12.09的权重为0.296,再往前的权重为0;网址权重——网站PC端的权重,设置成1.0,如京东PC端、淘宝PC端、汽车类PC端、房产类PC端等,手机端的权重,设置成2,如京东、淘宝、汽车类、房产类移动端等;次数权重——时间衰减因子相同时间段类,浏览1次权重1.0,2次权重1.5,3~5次权重2,6~10权重2.5,11~50次以上权重3,51~100次以上权重2.5,100次以上权重1.5。
7.根据权利1所述的按照关注度(标签权重)排序包括:
根据标签权重公式计算出用户对某商品型号的关注度(标签权重),再按照关注度进行排序,等于给出了用户所关注商品型号的程度高低;如:用户Tiger关注手机商品中,红米Note4X标签权重最大,是手机类第一关注商品;荣耀是手机类第二关注商品,OPPO A57是手机类第三关注商品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆山数泰数据技术有限公司,未经昆山数泰数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810147461.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:广告投放方法及系统
- 下一篇:一种发票开具及上传方法和系统