[发明专利]基于节目关系的视频节目的搜索方法和装置有效
申请号: | 201310589928.3 | 申请日: | 2013-11-20 |
公开(公告)号: | CN104657376B | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 孙科武;于志强;舒南飞;肖天柱;王芳 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 黄晓军 |
地址: | 100195 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 节目 关系 视频 搜索 方法 装置 | ||
1.一种基于节目关系的视频节目的搜索方法,其特征在于,计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:
对用户输入的搜索关键词进行结构化处理得到搜索向量;
从所述搜索向量中提取出视频节目的至少一个相关信息,利用所述至少一个相关信息通过设定的关系值计算公式分别计算出所述搜索向量与各个视频节目之间的关系值,其中,所述相关信息包括:视频导演、演员、编剧、国家、拍摄年份和剧情;
将和所述搜索向量之间的关系值大于设定的关系判断阈值的各个视频节目作为所述搜索关键词对应的初始视频搜索结果,利用所述关系网络对所述初始视频搜索结果进行扩展,得到最终的视频搜索结果。
2.根据权利要求1所述的基于节目关系的视频节目的搜索方法,其特征在于,所述的计算出两两视频节目之间的关系,建立多个视频节目之间的关系网络,包括:
从视频节目中提取出节目的相关信息,对所述相关信息进行结构化处理得到视频节目的结构化信息,所述结构化处理包括清除停用词,去除非法字符,分词中的至少一项,根据所述视频节目的结构化信息通过词频-反词频技术建立视频节目的属性空间;
根据各个视频节目的属性空间,计算出两个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到两个视频节目之间的关系值;
基于计算出的两两视频节目之间的关系,建立多个视频节目之间的关系网络,将所述关系网络和各个视频节目的属性空间存储在视频数据库中。
3.根据权利要求2所述的基于节目关系的视频节目的搜索方法,其特征在于,所述的根据各个视频节目的属性空间,计算出两个视频节目之间的相同属性之间的相关性值,将多个所述相关性值进行加权求和,将加权求和的结果进行归一化处理,得到两个视频节目之间的关系值,包括:
所述视频节目的属性空间中包括导演,演员,编剧,国家,拍摄年份,剧情中的至少一项,设两个视频节目为pi和pj;
所述视频节目pi、pj之间的导演相关性值的计算方法为:将节目pi的导演集mi记作m(pi,mi),节目pj的导演集mj记作m(pj,mj),存在mi∩mj≠Φ,则视频节目pi、pj之间的导演相关性值为m(pi,pj),所述m表示包括所有导演的导演集,|mi|表示导演集mi的模值,|mj|表示导演集mj的模值;
所述视频节目pi、pj之间的演员相关性值的计算方法为:将节目pi的演员集合ai记作a(pi,ai),节目pj的演员集合aj记作a(pj,aj),存在ai∩aj≠Φ,则视频节目pi、pj之间的演员相关性值为a(pi,pj),所述a表示包括所有演员的演员集,|ai|表示演员集ai的模值,|aj|表示演员集aj的模值;
所述视频节目pi、pj之间的编剧相关性值的计算方法为:将节目pi的编剧集合ei记作e(pi,ei),节目pj的编剧集合ej记作e(pj,ej),存在ei∩ej≠Φ,则视频节目pi、pj之间的编剧相关性值为e(pi,pj),所述e表示包括所有编剧的编剧集,|ei|表示编剧集ei的模值,|ej|表示编剧集ej的模值;
所述视频节目pi、pj之间的拍摄年份相关性值的计算方法为:将节目pi的拍摄年份yi记作y(pi,yi),将节目pj的拍摄年份yj记作y(pj,yj),则视频节目pi、pj之间的拍摄年份相关性值为y(pi,pi),
所述视频节目pi、pj之间的国家相关性值的计算方法为:将节目pi的发行国家ci记作c(pi,ci),将节目pj的发行国家cj记作c(pj,cj),存在ci=cj,则视频节目pi、pj之间的国家相关性值为c(pi,pj),
所述视频节目pi、pj之间的剧情相关值的计算方法为:将节目pi的标签集ti记作t(pi,ti),将节目pj的标签集tj记作t(pj,tj),存在标签的语义相似性,记作ti≈tj,那么pi和pj存在标签相关性,则视频节目pi、pj之间的标签相关性值为t(pi,pj),其中f(tk)是通过指定搜索引擎利用关键词tk检索网页得到的记录总数,f(tk,tl)是通过指定搜索引擎利用关键词tk,tl共同检索网页得到的记录总数,G是上述指定搜索引擎对应的网页总数;
对所述视频节目pi、pj之间的导演相关性值、演员相关性值、编剧相关性值、拍摄年份相关性值、国家相关性值、标签相关性值进行加权求和,得到视频节目pi和pj的关系大小rel(pi,pj),
rel(pi,pj)=αm(pi,pj)+βa(pi,pj)+χe(pi,pj)+δy(pi,pj)+εc(pi,pj)+γt(pi,pj)
其中,α,β,χ,δ,ε,γ为设定的权重值,α+β+χ+δ+ε+γ=1
对所述rel(pi,pj)进行量化,得到两个节目pi和pj之间的关系值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310589928.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文件缓存方法及装置
- 下一篇:一种数据处理方法及装置