[发明专利]数据分析方法及其系统在审
申请号: | 201210371691.7 | 申请日: | 2012-09-28 |
公开(公告)号: | CN103714063A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 赵石顽;吴贤;袁泉 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分析 方法 及其 系统 | ||
技术领域
本发明的实施方式总体上涉及数据处理,进一步本发明的实施方式涉及数据分析及其系统。
背景技术
数据分析已经在很多重要领域发挥重要作用。很多网络应用都向用户推荐商品(包括图书、电影等各种商品)以及推荐好友。比如在在线书店中,当用户购买或浏览图书时,在线书店可能向用户推荐他/她可能感兴趣的图书。再比如在在线社交网络中,用户可能被推荐好友。在线应用往往根据用户的个人数据和之前的网络行为进行推荐。借助于所述推荐系统,用户能够容易的获得更多的信息。但是很多推荐算法过于复杂(比如矩阵分解模型Matrix Factorization,某些基于概率的模型,基于图的模型等)导致推荐应用本身都无法解释为何向用户推荐某个项目而不是其它项目。此外,有些推荐系统即便给出推荐的理由,但是所述理由也不是个性化的,而是使用通用的理由进行推荐,比如当用户浏览一个在线书店的书A时,该在线书店将书B推荐给用户,其理由是购买了书A的其它用户也购买了书B。
发明内容
为了提供一种个性化的数据分析方法从而找到目标分析项目中有区别度的特征,发明提供一种数据分析方案。
具体而言,本发明提供一种数据分析方法,包括:获取样本数据,其中所述样本数据包含正样本数据和负样本数据,所述正样本数据包括用户所偏好的项目,并且所述负样本数据包含用户非偏好的项目;选择所述样本数据的判别性特征,其中所述判别性特征包括对区分正样本数据和负样本数据中的项目具有区分度的特征;对至少一个目标分析项目,确定其是否具有至少一个所述判别性特征;以及响应于具有至少一个所述判别性特征,将所述至少一个目标分析项目与至少一个所述判别性特征相关联。
本发明还提供一种数据分析系统,包括:获取装置,被配置为获取样本数据,其中所述样本数据包含正样本数据和负样本数据,所述正样本数据包括用户所偏好的项目,并且所述负样本数据包含用户非偏好的项目;选择装置,被配置为选择所述样本数据的判别性特征,其中所述判别性特征包括对区分正样本数据和负样本数据中的项目具有区分度的特征;确定装置,被配置为对至少一个目标分析项目,确定其是否具有至少一个所述判别性特征;以及关联装置,被配置为响应于具有至少一个所述判别性特征,将所述至少一个目标分析项目与至少一个所述判别性特征相关联。
通过本发明的数据分析方案可以个性化的识别目标分析项目中有区分度的特征,从而使得数据分析结果更加详尽、充实。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算系统100的框图。
图2示出了按照本发明的一个实施例的数据分析方法的流程图。
图3示出了按照本发明的一个实施例的选择判别性特征的流程图。
图4A示出了按照本发明的一个实施例的样本数据示意图。
图4B示出了按照本发明的另一个实施例的样本数据示意图。
图4C示出了按照本发明的又一个实施例的样本数据示意图。
图5示出了按照本发明的一个实施例的数据分析系统示意图。
图6示出了按照本发明的一个实施例的选择装置的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210371691.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光电信号接收电路
- 下一篇:家兔局部给药、染毒保定带
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置