[发明专利]用户画像构建方法与装置及推荐方法与装置有效
申请号: | 201710256098.0 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107145536B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 刘晨;桑海岩 | 申请(专利权)人: | 畅捷通信息技术股份有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06K9/62;G06Q30/06 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 构建 方法 装置 推荐 | ||
1.一种用户画像构建方法,其特征在于,包括:
获取用户的特征数据,确定所述特征数据的类型;
根据所述特征数据及所述特征数据的类型,构建数据画像;
根据所述数据画像构建所述用户画像;
所述根据所述特征数据及所述特征数据的类型,构建数据画像具体包括:
计算所述特征数据的词向量的平均值,通过所述词向量的平均值表达所述特征数据的语义;
根据所述特征数据的词向量的平均值,计算同一类型的所述特征数据的向量平均值,将所述向量平均值作为所述数据画像;
当所述特征数据包括一个或多个所述类型时,构建一个或多个所述数据画像。
2.根据权利要求1所述的用户画像构建方法,其特征在于,所述根据所述数据画像构建所述用户画像具体包括:
将所述一个或多个数据画像对应的所述向量平均值组成向量矩阵,将所述向量矩阵作为所述用户画像。
3.根据权利要求1所述的用户画像构建方法,其特征在于,所述计算所述特征数据的词向量的平均值的计算公式为:
其中,P为所述特征数据,VP为所述特征数据的词向量的平均值,Vi为一个词的词向量,n为大于等于1的整数。
4.根据权利要求1所述的用户画像构建方法,其特征在于,所述根据所述特征数据的词向量的平均值,计算同一类型的所述特征数据的向量平均值的计算公式为:
其中,所述VPi为所述特征数据的词向量的平均值,Vf为所述同一类型的所述特征数据的向量平均值,τi为时间衰减因数,λ的值为1,t为所述特征数据生成时间与所述向量平均值生成时间的时间差,n为大于等于1的整数。
5.根据权利要求2所述的用户画像构建方法,其特征在于,所述向量矩阵为:其中,Vfn为所述同一类型的所述特征数据的向量平均值,n为大于等于1的整数。
6.根据权利要求1至5中任一项所述的用户画像构建方法,其特征在于,
所述特征数据为所述用户的基本信息和/或所述用户的行为信息;所述特征数据的格式包括以下至少任一项或其组合:句子、段落、文章;所述特征数据的类型包括以下至少任一项或其组合:新闻、读书、服饰。
7.根据权利要求6所述的用户画像构建方法,其特征在于,
所述基本信息包括以下至少任一项或其组合:日志信息、兴趣爱好;
所述行为信息包括以下至少任一项或其组合:购买记录、访问记录。
8.一种用户画像构建装置,其特征在于,包括:
获取单元,用于获取用户的特征数据,确定所述特征数据的类型;
数据画像单元,用于根据所述特征数据及所述特征数据的类型,构建数据画像;
用户画像单元,用于根据所述数据画像构建所述用户画像;
所述数据画像单元具体包括:
第一计算单元,用于计算所述特征数据的词向量的平均值,通过所述词向量的平均值表达所述特征数据的语义;
第二计算单元,用于根据所述特征数据的词向量的平均值,计算同一类型的所述特征数据的向量平均值,将所述向量平均值作为所述数据画像;
所述数据画像单元,还用于当所述特征数据包括一个或多个所述类型时,构建一个或多个所述数据画像。
9.根据权利要求8所述的用户画像构建装置,其特征在于,所述用户画像单元具体用于:
将所述一个或多个数据画像对应的所述向量平均值组成向量矩阵,将所述向量矩阵作为所述用户画像。
10.根据权利要求8所述的用户画像构建装置,其特征在于,所述计算所述特征数据的词向量的平均值的计算公式为:
其中,P为所述特征数据,VP为所述特征数据的词向量的平均值,Vi为一个词的词向量,n为大于等于1的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于畅捷通信息技术股份有限公司,未经畅捷通信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710256098.0/1.html,转载请声明来源钻瓜专利网。