[发明专利]内容分发控制方法及装置在审

专利信息
申请号: 201710842563.9 申请日: 2017-09-18
公开(公告)号: CN107633460A 公开(公告)日: 2018-01-26
发明(设计)人: 刘兵;吴友政 申请(专利权)人: 北京奇艺世纪科技有限公司
主分类号: G06Q50/00 分类号: G06Q50/00;G06F17/30
代理公司: 北京润泽恒知识产权代理有限公司11319 代理人: 莎日娜
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 内容 分发 控制 方法 装置
【说明书】:

技术领域

发明涉及互联网技术领域,特别是涉及一种内容分发控制方法及装置。

背景技术

社交网络服务(Social Network Service,SNS),专指旨在帮助用户建立社会性网络的互联网应用服务,其代表产品包括微信,微博、以及各种社交网站(如facebook,twitter)等。SNS不仅提供了丰富的应用场景,同时也为商业化带来巨大的想象空间。例如通过数据挖掘实现精准推荐,把“广告”变成用户感兴趣的“资讯”。

发明内容

为了提高互联网内容分发的精准度,本发明实施例提供一种内容分发控制方法及装置。

根据本发明的一个方面,提供一种内容分发控制方法,包括:从互联网数据源爬取得到互联网内容;对所述互联网内容进行特征识别,得到至少一个候选圈子名;对所述候选圈子名与所述互联网内容进行相关性分析,根据相关性分析的结果从所述候选圈子名对应的候选圈子中确定出目标圈子;控制在所述目标圈子中分发所述互联网内容。

在一个可选的方式中,所述对互联网内容进行特征识别,得到至少一个候选圈子名,包括:提取出互联网内容中的文本内容,对所述文本内容进行文字识别,得到至少一个第一圈子名;和/或,提取出互联网内容中的多媒体内容,对所述多媒体内容进行图像识别,得到至少一个第二圈子名;在仅得到第一圈子名或仅得到第二圈子名情况下,将第一圈子名或第二圈子名作为所述候选圈子名;在得到第一圈子名以及第二圈子名情况下,融合所述第一圈子名和所述第二圈子名,得到所述至少一个候选圈子名。

在一个可选的方式中,所述对所述文本内容进行文字识别,得到至少一个第一圈子名,包括:对所述文本内容进行分词处理,从分词中识别出所述第一圈子名;其中,所述第一圈子名为人物名、剧名、地名、事件名、话题名、机构名中的一项或多项。

在一个可选的方式中,所述对所述多媒体内容进行图像识别,得到至少一个第二圈子名,包括:对多媒体内容中的图片或视频进行图像识别,得到第二圈子名;其中,所述第二圈子名包括人物名、剧名、地名、事件名、话题名、机构名中的一项或多项。

在一个可选的方式中,还包括:根据所述第一圈子名在所述文本内容中的位置,为不同位置设置不同的位置权值;确定所述第一圈子名在所述文本内容中位置权值最高的出现位置,并统计所述第一圈子名在所述文本内容中的出现次数;采用三元组记录所述第一圈子名、第一圈子名位置权值最高的出现位置和第一圈子名出现次数,得到第一圈子名记录列表;统计第二圈子名在所述多媒体内容中出现的次数;采用二元组记录所述第二圈子名和所述第二圈子名出现次数,得到第二圈子记录列表;将所述第一圈子记录列表和所述第二圈子名记录列表进行取并集操作,得到候选圈子名列表,所述候选圈子名列表包括所述至少一个候选圈子名。

在一个可选的方式中,所述对所述候选圈子名与所述互联网内容进行相关性分析,包括:分析候选圈子特征与互联网内容特征的相关性,得到所述候选圈子名与所述互联网内容的相关性得分;

在一个可选的方式中,所述从候选圈子中确定出目标圈子,包括:将所述相关性得分与预置的相关性分值最低阈值进行比较,从所述候选圈子中选取出得分高于最低阈值的圈子作为目标圈子;和/或,预先设定目标圈子占候选圈子最高占比阈值,按照相关性得分从高至低,从所述候选圈子中选取最高占比阈值比例的候选圈子作为目标圈子。

根据本发明的一个方面,提供一种内容分发控制装置,包括:爬取单元,用于从互联网数据源爬取得到互联网内容;识别单元,用于对所述互联网内容进行特征识别,得到至少一个候选圈子名;分析单元,对所述候选圈子名与所述互联网内容进行相关性分析;决策单元,用于根据相关性分析的结果从所述候选圈子名对应的候选圈子中确定出目标圈子;控制单元,用于控制在所述目标圈子中分发所述互联网内容。

在一个可选的方式中,所述识别单元包括:文字识别子单元,用于提取出互联网内容中的文本内容,对所述文本内容进行文字识别,得到至少一个第一圈子名;和/或,图像识别子单元,用于提取出互联网内容中的多媒体内容,对所述多媒体内容进行图像识别,得到至少一个第二圈子名;融合子单元,用于在仅得到第一圈子名或仅得到第二圈子名情况下,将第一圈子名或第二圈子名作为所述候选圈子名;在得到第一圈子名以及第二圈子名情况下,融合所述第一圈子名和所述第二圈子名,得到所述至少一个候选圈子名。

在一个可选的方式中,所述文字识别子单元具体用于,对所述文本内容进行分词处理,从分词中识别出所述第一圈子名;其中,所述第一圈子名为人物名、剧名、地名、事件名、话题名、机构名中的一项或多项。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710842563.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top