[发明专利]用户画像知识相似度计算方法有效
| 申请号: | 202010856930.2 | 申请日: | 2020-08-24 |
| 公开(公告)号: | CN111737588B | 公开(公告)日: | 2021-01-08 |
| 发明(设计)人: | 曹保龙;彭天颖;王磊;卢浩然;周苏霞 | 申请(专利权)人: | 南京国睿信维软件有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/16;G06K9/62 |
| 代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 凤婷 |
| 地址: | 210013 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 画像 知识 相似 计算方法 | ||
本发明公开了用户画像知识相似度计算方法,属于智能分析技术领域,首先,规定用户的重要行为及个人基础属性选取个数及以及具体行为操作和属性内容。其次,对每项用户行为及用户属性的进行参数赋权,决定用户行为和用户属性在整体知识相似度计算中的比重值。抽取用户的行为记录和属性,统计用户行为访问过知识关联的标签,并对标签一一赋权。最后,汇集用户知识标签的总体权重值,根据权重高低排序,得出用户知识画像。本发明基于用户行为操作及个人基础属性的参数权重计算知识相似度,通过用户的具体行为操作绘制用户画像,并相应地返回适配的相似知识。该方法的知识推荐准确度高,推荐比例可以动态调整,操作便捷。
技术领域
本发明涉及一种用户画像知识相似度计算方法,属于智能分析技术领域。
背景技术
当今是一个海量数据的时代,用户在各网站都能接收到大量信息。这其中有很大一部分都是无效、重复、或者用户不感兴趣的垃圾流量。用户在查询知识时需要花费大量的时间、精力来遍历搜索结果,或在茫茫知识库中打捞。为了向用户精准投放符合用户行为习惯及个人特征的相似知识,需要一种能够动态调整权重比例,并按照单篇知识的标签进行统计,得出用户知识画像和个人知识标签,进行动态知识相似推荐。
发明内容
为了解决上述技术问题,本发明提供一种用户画像知识相似度计算方法,其具体技术方案如下:
用户画像知识相似度计算方法,其特征在于:包括以下步骤
步骤一:统计影响用户画像的标准行为及基础属性,所述标准行为包括查看、点赞、分享、收藏、下载、评论和提问,所述基础属性包括部门、岗位、角色和专业;
步骤二:给标准行为及基础属性分配权重,设定每个参数的权重,并记为,具体为:
所述标准行为选取下载、提问、收藏、分享、评论5种行为操作,所述基础属性选取部门和岗位,合计7个参数;
每个参数的权重可表示为;
标签矩阵具体可表示为:、、、、、、;
加权矩阵具体为:,,,,,,;
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
步骤四:根据知识标签,整理成标签矩阵,标准行为依次用大写字母表示,得到标签矩阵、、、,其中n表示标准行为的对象个数,m表示设定的选取关联标签的个数;
标签矩阵的具体获得过程为:
用户的标准行为A的对象有个,每个对象有个标签,得到一个知识相关联的标签矩阵:,将其记为矩阵(),其中,为标准行为A的第个对象的第个标签;
取每个对象最多关联5个标签,即,当对象的标签数小于5时,则超过对象标签数的为空值;
步骤五:对标签矩阵内的每个标签赋权,得到加权矩阵、、、,
其中每一项标签都可以表现为;
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识,具体过程为:
步骤a:记录标签为对象,记录标签为对象,,记录标签为对象,当遇到重复标签时,仅增加对象权重,不新增标签对象,
统计矩阵内的标签权重,矩阵内最多有个标签,其中对象出现次,对象出现次,……,对象出现次,推算出对象的权重为,整个矩阵内所有标签的权重之和为,保证权重的总和始终是对该操作预设的权重值,标准行为A对应的标签数组对应权重,这是一个1的矩阵,其和为;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京国睿信维软件有限公司,未经南京国睿信维软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010856930.2/2.html,转载请声明来源钻瓜专利网。





