[发明专利]一种确定对象相关性的方法和装置在审

专利信息
申请号: 201711459638.1 申请日: 2017-12-28
公开(公告)号: CN110020169A 公开(公告)日: 2019-07-16
发明(设计)人: 王鑫 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F16/9535 分类号: G06F16/9535
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 张一军;杨晓伟
地址: 100195 北京市海淀区杏石口路6*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 方法和装置 计算机技术领域 技术效果 快速确定 余弦公式 时间段 关联 话题 发现
【说明书】:

发明公开了一种确定对象相关性的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取指定时间段内的第一对象和第二对象,以及第一对象出现的频率和第二对象出现的频率;基于第一对象出现的频率和第二对象出现的频率,利用余弦公式确定出第一对象和第二对象之间的相关性。该实施方式克服了现有技术中无法确定出话题中所包含的各个对象之间的对应关系的技术问题,进而达到快速确定出各个对象之间的相关性的技术效果,有利于发现各个对象之间隐形的对应关系,从而提高各个对象之间的关联强度。

技术领域

本发明涉及计算机技术领域,尤其涉及一种确定对象相关性的方法和装置。

背景技术

随着互联网的发展,舆情数据越来越受到人们的重视,基于舆情数据的话题和事件,往往能够影响到一个企业或者事物的发展,所以针对舆情中的话题的分析也越来越受到人们的重视。

舆情中的话题,往往包含了很多信息,其中就包括一些针对实物产品的议论以及其他与实物产品相关的新闻和事件。针对话题事件与实物产品的关联,已经开始慢慢体现出其价值。

当前针对话题与实物产品之间的关联,往往是通过查找当前话题下的新闻或者微博中,是否出现过相关的实物产品词。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

1、因为舆情数据中的产品词,往往不是一个真正意义上的产品,都是一些口语化的表达。直接进行查找的话,召回率较低,例如:“iPhone6s 64G红色”这个产品词,在话题中查找,召回率很低;但是“apple”、“苹果”、“6s”等产品词却有很高的出现频次。

2、在话题中直接查找出来的产品词,往往跟话题本身关联不大,例如:“王宝强”事件的新闻中会出现“iPhone手机”等,并不能指明其是相关的,有可能是因为用户使用iPhone手机转载的,所以才会会出现“iPhone手机”等词。

3、话题与产品的相关性,往往不一定在文本内容中体现出来,一些隐性的相关性不能直接通过简单的匹配来查找,例如:“泰国地震”会导致“硬盘”价格上涨,其中隐藏的原因是因为大多数的硬盘生产厂都设立在泰国。

因此,如何确定出话题中所包含的各个对象之间的对应关系,是一个亟待解决的问题。

发明内容

有鉴于此,本发明实施例提供一种确定对象相关性的方法和装置,能够基于各个对象出现的频率,确定出各个对象之间的相关性和对应关系。

为实现上述目的,根据本发明实施例的一个方面,提供了一种确定对象相关性的方法。

本发明实施例的一种确定对象相关性的方法包括:获取指定时间段内的第一对象和第二对象,以及第一对象出现的频率和第二对象出现的频率;基于第一对象出现的频率和第二对象出现的频率,利用余弦公式确定出第一对象和第二对象之间的相关性。

在本发明的一实施例中,获取指定时间段内的第一对象和第二对象,以及第一对象出现的频率和第二对象出现的频率的步骤包括:获取多个第一对象和多个第二对象,以及每个第一对象出现的频率和每个第二对象出现的频率;在获取指定时间段内的第一对象和第二对象,以及第一对象出现的频率和第二对象出现的频率的步骤之后,还包括:根据预设的频率阈值,对多个第一对象和多个第二对象进行过滤,以得到频率大于频率阈值的第一频率对象和第二频率对象。

在本发明的一实施例中,余弦公式为:

其中,ST(A,B)表示在时间段T内A与B之间的相关性,A代表第一对象,B代表第二对象;nAi表示在第i天时第一对象出现的频率;nBi表示在第i天时第二对象出现的频率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711459638.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top