[发明专利]一种更新对等网络版权内容相似度图的方法及系统有效
申请号: | 201210288837.1 | 申请日: | 2012-08-14 |
公开(公告)号: | CN103595740A | 公开(公告)日: | 2014-02-19 |
发明(设计)人: | 曲本科;牛温佳;童恩栋;苗光胜;唐晖;谭红艳;慈松 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L29/06;H04L12/18;G06F21/10 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 更新 对等 网络 版权 内容 相似 方法 系统 | ||
技术领域
本发明涉及P2P网络版权内容传播过程中内容相似度图的局部动态更新方法,具体涉及一种更新对等网络版权内容相似度图的方法及系统。
背景技术
内容关系网络挖掘旨在通过揭示内容之间的相似度关系来深入发掘P2P用户之间的文件共享关系,深刻反映出对等网络内容交互与分布的内部结构,为传播分析与管控提供有效支持。部分研究者对此提出的P2P网络版权内容相似度图(Copyright Content Similarity Graph,CCSG)的概念来描述内容关系网络,本发明的发明人在另一篇申请号为“201210240796.9”、名称为《一种对等网络版权内容相似度图的构建方法及系统》的申请文件中针对内容相似度图CCSG的构建进行分析研究并提出改进的构建方法,且具体的构建方法是基于如表1所示的构建模型的。而本发明延续对P2P网络版权内容相似度图CCSG的研究,探讨在完成构建过程后,如何对CCSG进行更好的更新的方法。
为清楚表述本发明内容,首先对CCSG的结构和构建进行简要描述。从图1可知,所述内容相似度图中包含的元素为:若干内容节点、连接内容节点间的无向边及对应于各无向边权重值;且所述内容节点表示某个音/视频内容,可以综合运用内容名称及内容描述元数据来标识;若存在某个用户同时拥有两个内容,则对应的内容节点通过所述无向边连接。在无向边权重计算方面,CCSG基于如下事实,即如果同时拥有两个内容的用户数目越大,则意味着内容之间的相似度越大,对应的无向边权重也越大。
本申请的发明人在上述《一种对等网络版权内容相似度图的构建方法及系统》提出用户综合客观行为模型——COB模型,以及基于用户综合客观行为COB模型的用户威胁程度判断模型和内容扩散能力预测模型进而提出了改进的CCSG构建流程。其中,在CCSG构建过程中提出的各种模型如表1所示。
表1.针对改进的CCSG构建过程提出的模型
为便于可视化地展现内容节点的扩散能力,系统对节点的扩散能力范围进行区间划分,分出红、黄、绿、蓝四个层次,对不同扩散能力的版权内容节点进行层次过滤并添加不同的颜色属性。这样通过对节点进行着色,系统得以直观地展现CCSG中版权内容扩散能力的分布情况。
总之上述专利申请提供的CCGS图的构建方法综合考虑了包含用户客观行为的行为时间、行为数量和行为性质,即在构建CCGS图时对用户客观行为综合定量和定性进行了考虑,因此能够基于上述方法构建的CCGS图对于提高内容传播分析与管控的全面性和有效性上有了很大提高。本发明的提供的更新方法也是基于上述方法建立的CCGS图。
现有的CCSG构建方法仅仅定性地分析了用户客观行为的事件行为,主要指某个用户下载了某个内容或某个用户上传了某个内容,而对于用户客观行为中的行为时间、行为数量及行为性质,缺乏定量和定性的全面分析,而忽视对用户客观行为的综合定量和定性考虑,将会大大影响内容传播分析与管控的全面性和有效性。《一种对等网络版权内容相似度图的构建方法及系统》弥补了这方面的不足,其首次建立包括事件行为、行为时间、行为数量和行为性质在内的用户综合客观行为模型;基于该综合客观行为模型,计算用户威胁程度和内容扩散趋势,并将计算结果导入GKM聚类算法,从数据预处理和聚类两个步骤对整个构建过程分别实现一头一尾的改进,提高CCSG的全面性和准确性。详见《一种对等网络版权内容相似度图的构建方法及系统》。
针对P2P网络,要达到预测侵权内容扩散趋势,进而完成预先区域预警和管控这一目标,仅仅通过一张静态的CCSG是无法达到目的的。CCSG所反映的仅仅是当前时刻P2P网络中版权内容的扩散能力分布情况,要查看在一段时间内CCSG中版权内容扩散能力的系列变化,甚至是观察CCSG的动态演变过程,需要对CCSG进行定时或实时更新。且本发明所述的更新P2P网络版权内容相似度图具体是指代更新该图中包含的版权内容节点扩散能力信息、节点间无向边权重信息即节点内容扩散能力相似度以及内容节点的颜色属性。
现有技术在CCSG更新过程中,通过更新CCSG存储数据,包括更新已有的数据和捕获新的数据(比如出现了哪些新的内容,出现了哪些新的用户等),并以此为基础,重新进入CCSG的构建过程。CCSG的整体构建过程如图2所示。每次CCSG更新过程都需要完全完整地执行每一步骤即爬虫程序获取P2P网络中的内容信息、内容信息完全替换数据库已有内容信息、利用数据库中的新载入的数据重新完整绘制一幅CCSG图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210288837.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于多天线的地面穿透雷达的合并显示
- 下一篇:带有用于微板的启盖机的酶标仪