[发明专利]项目间关联关系挖掘方法、装置、计算设备及存储介质在审
| 申请号: | 201810661422.1 | 申请日: | 2018-06-25 |
| 公开(公告)号: | CN109062955A | 公开(公告)日: | 2018-12-21 |
| 发明(设计)人: | 柯文炜;何治民 | 申请(专利权)人: | 广东神马搜索科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
| 地址: | 510627 广东省广州市天河区黄埔大*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关联度 关联关系 顺序建立 存储介质 计算设备 顺序相反 挖掘 方式记录 非对称性 数据库 记录 应用 | ||
1.一种项目间关联关系挖掘方法,包括:
建立项目对,在所述项目对中,以能够区分的方式记录第一项目和第二项目;以及
针对所述项目对,确定并在关联关系数据库中与所述项目对关联地记录所述项目对的单向关联度,所述单向关联度表示所述第二项目相对于所述第一项目的关联度,而不表示所述第一项目相对于所述第二项目的关联度,
其中,在两个项目以第一顺序建立第一项目对的情况下,不以与所述第一顺序相反的第二顺序建立第二项目对;或者
对于两个项目,以第一顺序建立第一项目对,并以与所述第一顺序相反的第二顺序建立第二项目对,所述第二项目对的单向关联度不同于所述第一项目对的单向关联度。
2.根据权利要求1所述的方法,其中,所述建立项目对的步骤包括:
从具有项目间指向关系或时间顺序的项目序列中挖掘所述项目对,其中所述第一项目和所述第二项目在所述项目序列中具有预定的指向关系或时间顺序。
3.根据权利要求2所述的方法,其中,所述确定项目对的单向关联度的步骤包括:
至少部分地基于所述第一项目和所述第二项目在多个项目序列中按所述项目对对应的顺序出现的频次和/或时间跨度统计值和/或间隔项目数统计值,确定所述项目对的单向关联度。
4.根据权利要求2所述的方法,其中,所述建立项目对的步骤包括:
以预定项目或预定类型的项目作为所述第一项目;并且/或者
以预定项目或预定类型的项目作为所述第二项目。
5.根据权利要求2所述的方法,其中,
所述项目是用户行为,所述项目序列是包括预定长度时间窗口中的同一个用户的多个用户行为的用户行为序列;或者
所述项目序列是包括预定长度时间窗口中用户依次访问的多个项目的项目序列。
6.根据权利要求2所述的方法,其中,所述确定项目对的单向关联度的步骤包括:
基于对所述第一项目的特征和所述第二项目的特征对称的对称公式,确定所述项目对的单向关联度。
7.根据权利要求1所述的方法,其中,所述确定项目对的单向关联度的步骤包括:
基于对所述第一项目的特征和所述第二项目的特征不对称的非对称公式,确定所述项目对的单向关联度。
8.根据权利要求7所述的方法,其中,
在所述非对称公式的分子或分母中,仅涉及所述第一项目的特征或所述第二项目的特征;或者
在所述非对称公式的分子或分母中,对所述第一项目的特征和所述第二项目的特征设置不同的幂次。
9.根据权利要求8所述的方法,其中,
所述关联关系用于项目推荐,在所述非对称公式的分母中,所述第一项目的特征的幂次低于所述第二项目的特征的幂次;或者
所述关联关系用于发现版本摘录情形,所述项目为文本,所述第一项目的特征为所述第一项目所包含的第一元素集合,所述第二项目的特征为所述第二项目所包含的第二元素集合,所述非对称公式包括第一元素集合和第二元素集合的交集的元素个数与第一元素集合的元素个数之商;或者
所述关联关系用于发现版本盗用情形,所述项目为文本,所述第一项目的特征为所述第一项目所包含的第一元素集合,所述第二项目的特征为所述第二项目所包含的第二元素集合,所述非对称公式包括第一元素集合和第二元素集合的交集的元素个数与第二元素集合的元素个数之商。
10.根据权利要求9所述的方法,其中,
所述关联关系用于项目推荐,项目的特征为该项目的热门程度、与该项目直接关联的其它项目的数量、该项目在项目访问网络中的经过路径数量中的一项或多项。
11.根据权利要求1-10中任何一项所述的方法,其中,所述确定项目对的单向关联度的步骤包括:
使用随所述第一项目和所述第二项目的共同出现频率升高而减小的衰减因子来修正所述单向关联度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东神马搜索科技有限公司,未经广东神马搜索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810661422.1/1.html,转载请声明来源钻瓜专利网。





