[发明专利]用户画像知识相似度计算方法有效
| 申请号: | 202010856930.2 | 申请日: | 2020-08-24 |
| 公开(公告)号: | CN111737588B | 公开(公告)日: | 2021-01-08 |
| 发明(设计)人: | 曹保龙;彭天颖;王磊;卢浩然;周苏霞 | 申请(专利权)人: | 南京国睿信维软件有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/16;G06K9/62 |
| 代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 凤婷 |
| 地址: | 210013 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 画像 知识 相似 计算方法 | ||
1.用户画像知识相似度计算方法,其特征在于:包括以下步骤:
步骤一:统计影响用户画像的标准行为及基础属性;
步骤二:给标准行为及基础属性分配权重,标准行为选取下载、提问、收藏、分享、评论5种行为操作,所述基础属性选取部门和岗位,合计7个参数,设定每个参数的权重,依次记为;
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
步骤四:根据知识标签,整理成标签矩阵,知识标签依次用大写字母表示,得到知识标签矩阵、、、、、、;其中n表示标准行为和基础属性对应的知识个数,m表示每个知识设定的选取关联标签的个数;
其中,标签矩阵的具体获得过程为:
用户的标准行为A的知识有个,,每个知识有个标签,得到一个知识相关联的标签矩阵:,将其记为标签矩阵,其中,为标准行为A的第个知识的第个标签;
取每个知识最多关联5个标签,即,当标准行为A的第个知识的标签个数小于5时,则超过实际标签数的为空值;
步骤五:对标签矩阵内的每个标签赋权,得到加权矩阵、、、、、、,
其中,
其中每一项标签都表现为,1in,1jm;
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识,具体过程为:
步骤a:记录标签为,记录标签为,,记录标签为,,记录标签为,当遇到重复标签时,仅增加知识权重,不新增标签个数,
统计标签矩阵内的标签权重,标签矩阵内最多有个标签,其中标签出现次,标签出现次,……,标签出现次,推算出,标签的权重为,整个标签矩阵内所有标签的权重之和为,保证权重的总和始终是对该操作预设的权重值,标准行为A对应的标签数组中的各个标签对应的权重为,这是一个1的一维矩阵记为,其权重和为;
步骤b:计算所有知识标签的权重,得到7个1的矩阵,将其组合成一个7的权重矩阵;
步骤c:对照标签矩阵,整理重复标签,若代表的标签与代表的标签和代表的标签相同,那么标签的最终权重为标签的权重与的权重和的权重的总和,化为0,化为0;
步骤d:对矩阵进行矩阵化简,得到一个最简行阶梯型矩阵:,并排列大小,整理对应的标签;
步骤e:按照标签权重的大小,从高到低,梳理对应标签,组成权重与标签向量组,,……,其中,;
得到一系列按照权重高低排列的标签数组,标签数组就是用户行为及基础信息综合权重得到的用户画像标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京国睿信维软件有限公司,未经南京国睿信维软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010856930.2/1.html,转载请声明来源钻瓜专利网。





