[发明专利]内容分发控制方法及装置在审
申请号: | 201710842563.9 | 申请日: | 2017-09-18 |
公开(公告)号: | CN107633460A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 刘兵;吴友政 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 分发 控制 方法 装置 | ||
技术领域
本发明涉及互联网技术领域,特别是涉及一种内容分发控制方法及装置。
背景技术
社交网络服务(Social Network Service,SNS),专指旨在帮助用户建立社会性网络的互联网应用服务,其代表产品包括微信,微博、以及各种社交网站(如facebook,twitter)等。SNS不仅提供了丰富的应用场景,同时也为商业化带来巨大的想象空间。例如通过数据挖掘实现精准推荐,把“广告”变成用户感兴趣的“资讯”。
发明内容
为了提高互联网内容分发的精准度,本发明实施例提供一种内容分发控制方法及装置。
根据本发明的一个方面,提供一种内容分发控制方法,包括:从互联网数据源爬取得到互联网内容;对所述互联网内容进行特征识别,得到至少一个候选圈子名;对所述候选圈子名与所述互联网内容进行相关性分析,根据相关性分析的结果从所述候选圈子名对应的候选圈子中确定出目标圈子;控制在所述目标圈子中分发所述互联网内容。
在一个可选的方式中,所述对互联网内容进行特征识别,得到至少一个候选圈子名,包括:提取出互联网内容中的文本内容,对所述文本内容进行文字识别,得到至少一个第一圈子名;和/或,提取出互联网内容中的多媒体内容,对所述多媒体内容进行图像识别,得到至少一个第二圈子名;在仅得到第一圈子名或仅得到第二圈子名情况下,将第一圈子名或第二圈子名作为所述候选圈子名;在得到第一圈子名以及第二圈子名情况下,融合所述第一圈子名和所述第二圈子名,得到所述至少一个候选圈子名。
在一个可选的方式中,所述对所述文本内容进行文字识别,得到至少一个第一圈子名,包括:对所述文本内容进行分词处理,从分词中识别出所述第一圈子名;其中,所述第一圈子名为人物名、剧名、地名、事件名、话题名、机构名中的一项或多项。
在一个可选的方式中,所述对所述多媒体内容进行图像识别,得到至少一个第二圈子名,包括:对多媒体内容中的图片或视频进行图像识别,得到第二圈子名;其中,所述第二圈子名包括人物名、剧名、地名、事件名、话题名、机构名中的一项或多项。
在一个可选的方式中,还包括:根据所述第一圈子名在所述文本内容中的位置,为不同位置设置不同的位置权值;确定所述第一圈子名在所述文本内容中位置权值最高的出现位置,并统计所述第一圈子名在所述文本内容中的出现次数;采用三元组记录所述第一圈子名、第一圈子名位置权值最高的出现位置和第一圈子名出现次数,得到第一圈子名记录列表;统计第二圈子名在所述多媒体内容中出现的次数;采用二元组记录所述第二圈子名和所述第二圈子名出现次数,得到第二圈子记录列表;将所述第一圈子记录列表和所述第二圈子名记录列表进行取并集操作,得到候选圈子名列表,所述候选圈子名列表包括所述至少一个候选圈子名。
在一个可选的方式中,所述对所述候选圈子名与所述互联网内容进行相关性分析,包括:分析候选圈子特征与互联网内容特征的相关性,得到所述候选圈子名与所述互联网内容的相关性得分;
在一个可选的方式中,所述从候选圈子中确定出目标圈子,包括:将所述相关性得分与预置的相关性分值最低阈值进行比较,从所述候选圈子中选取出得分高于最低阈值的圈子作为目标圈子;和/或,预先设定目标圈子占候选圈子最高占比阈值,按照相关性得分从高至低,从所述候选圈子中选取最高占比阈值比例的候选圈子作为目标圈子。
根据本发明的一个方面,提供一种内容分发控制装置,包括:爬取单元,用于从互联网数据源爬取得到互联网内容;识别单元,用于对所述互联网内容进行特征识别,得到至少一个候选圈子名;分析单元,对所述候选圈子名与所述互联网内容进行相关性分析;决策单元,用于根据相关性分析的结果从所述候选圈子名对应的候选圈子中确定出目标圈子;控制单元,用于控制在所述目标圈子中分发所述互联网内容。
在一个可选的方式中,所述识别单元包括:文字识别子单元,用于提取出互联网内容中的文本内容,对所述文本内容进行文字识别,得到至少一个第一圈子名;和/或,图像识别子单元,用于提取出互联网内容中的多媒体内容,对所述多媒体内容进行图像识别,得到至少一个第二圈子名;融合子单元,用于在仅得到第一圈子名或仅得到第二圈子名情况下,将第一圈子名或第二圈子名作为所述候选圈子名;在得到第一圈子名以及第二圈子名情况下,融合所述第一圈子名和所述第二圈子名,得到所述至少一个候选圈子名。
在一个可选的方式中,所述文字识别子单元具体用于,对所述文本内容进行分词处理,从分词中识别出所述第一圈子名;其中,所述第一圈子名为人物名、剧名、地名、事件名、话题名、机构名中的一项或多项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710842563.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种互联网加姓氏族园
- 下一篇:一种营业厅收电费系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法