[发明专利]一种文件切片方法及所切片段流行度的计算方法有效
| 申请号: | 200910082349.3 | 申请日: | 2009-04-14 |
| 公开(公告)号: | CN101645923A | 公开(公告)日: | 2010-02-10 |
| 发明(设计)人: | 尤佳莉;王劲林;王玲芳;邓浩江 | 申请(专利权)人: | 中国科学院声学研究所 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08 |
| 代理公司: | 北京法思腾知识产权代理有限公司 | 代理人: | 杨小蓉 |
| 地址: | 100190北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种基于文件时域访问特征的文件切片方法和片段流行度的计算方法。其通过对文件在时域上访问特征进行分析,估计出该文件在不同时间段被点播的概率,根据用户点播倾向将媒体文件切分成不等长的数据片段,然后计算各个所切片段的流行度,从而获得文件中不同时间段较准确的流行度信息。本发明的基于文件时域访问特征的文件切片方法和片段流行度的计算方法,针对文件时域访问特征的不同,对大文件进行合理划分,以片段为单位进行副本放置,将大文件切分成变长的片段,使网络有针对性的对重要的片段提供更多服务,提高了空间的利用率,同时也增加了用户访问内容的命中率。 | ||
| 搜索关键词: | 一种 文件 切片 方法 流行 计算方法 | ||
【主权项】:
1、一种基于文件时域访问特征的文件切片方法,其特征在于,通过对文件在时域上访问特征进行分析,估计出该文件在不同时间段被点播的概率,根据用户点播倾向将媒体文件切分成不等长的数据片段,具体包括如下步骤:1)获取大量用户对文件的历史访问信息;2)根据用户对文件f的历史访问数据,拟合估计得到用户对某个文件f的访问规律f(x);3)利用概率累积相等的方式进行文件切片,假设每个数据片段block的积分为ave_culSeg,当对文件f进行切分时,从文件头开始,向后寻找使得当前数据片段block的概率积分为ave_culSeg的切分点segPoint_1,得到block_1,同样,从segPoint_1开始,寻找下一个符合积分条件的切分点segPoint_2,得到block_2,以此类推,直至将整个f切分成block序列为止,从而将文件f切分成不等长的block序列{block_1,block_2,...,block_n}。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910082349.3/,转载请声明来源钻瓜专利网。
- 上一篇:心脏射频消融电刀笔
- 下一篇:一种收集机械能发电的发光笔





