[发明专利]用户兴趣的挖掘方法及系统有效
申请号: | 202010063555.6 | 申请日: | 2020-01-20 |
公开(公告)号: | CN113139085B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 牛心怡;吴安新;王瑜 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/78;G06F16/783;G06F40/284 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 邓小玲;邓应山 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 兴趣 挖掘 方法 系统 | ||
1.一种用户兴趣的挖掘方法,其特征在于,所述方法包括:
获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
根据所述视频信息确定所述视频信息所属的兴趣类别;
统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;
其中,所述根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值,包括:
根据每种视频操作的总执行次数确定对应的视频操作的权重;
所述根据每种视频操作的总执行次数确定对应的视频操作的权重,包括:
将每种视频操作的次数进行倒数计算,并得到每种视频操作的倒数计算结果;
将每种视频操作的倒数计算结果进行比例计算,以得到每种视频操作相应的权重;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和所述对应的视频操作的权重,计算每个用户在每种兴趣类别的分值;
根据所述分值确定与所述分值对应的用户对应的兴趣类别。
2.如权利要求1所述的挖掘方法,其特征在于,所述根据所述视频信息确定所述视频信息所属的兴趣类别,包括:
将所述视频信息进行处理,以从所述视频信息中提取出核心词;
将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别。
3.如权利要求2所述的挖掘方法,其特征在于,所述将所述视频信息进行处理,以从所述视频信息中提取出核心词,包括:
将所述视频信息进行分词处理以得到分词结果;
将所述分词结果进行词义识别,以筛选出具有词义的关键词;
将所述关键词与预设词库中的词语进行匹配;
当匹配成功时,则确定所述关键词为所述核心词。
4.如权利要求2所述的挖掘方法,其特征在于,所述将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别,包括:
将所述核心词与所述预设核心词分别进行词向量处理,以得到与所述核心词对应的第一词向量和与所述预设核心词对应的第二词向量;
利用余弦相似度算法计算所述第一词向量和所述第二词向量的相似度;
当所述相似度高于预设相似度时,则确定所述视频信息属于所述预设核心词对应的目标兴趣类别,并将所述核心词加入至所述预设词库中。
5.如权利要求1所述的挖掘方法,其特征在于,每个所述用户在每种兴趣类别的分值计算公式为:
其中,j表示第j种兴趣类别,Cj表示每个用户在所述第j种兴趣类别的分值,N表示视频操作种数,i表示第i种视频操作,ki,j表示每个用户执行所述第j种兴趣类别中所述第i种视频操作的次数,wi表示所述第i种视频操作的权重。
6.如权利要求1或5所述的挖掘方法,其特征在于,所述根据所述分值确定与所述分值对应的用户对应的兴趣类别,包括:
将所述分值分别与多个兴趣类别的预设分值进行比较;
当所述分值高于所述预设分值时,则确定所述用户为与所述预设分值对应的兴趣类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063555.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:海绵红球菌来源的抗病原菌活性化合物的制备及用途
- 下一篇:套管系统