[发明专利]新闻视频的搜索方法和装置有效

专利信息
申请号: 201010280175.4 申请日: 2010-09-09
公开(公告)号: CN101944111A 公开(公告)日: 2011-01-12
发明(设计)人: 朱明;尹文科;崔昊旻;李自勉 申请(专利权)人: 中国科学技术大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京凯特来知识产权代理有限公司 11260 代理人: 郑立明;孟丽娟
地址: 230026*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 新闻 视频 搜索 方法 装置
【说明书】:

技术领域

发明涉及计算机应用技术领域,尤其涉及一种新闻视频的搜索方法和装置。

背景技术

为了支持三网融合业务演进,需要研究如何基于资源有限的终端设备,支持开展更多的电视业务,尤其是目前电视业务中比较吸引观众的新闻业务。如何使电视观众可以随时收看电视新闻,享受电视新闻的个性化与专题化的服务,成为了三网融合背景下值得关注的问题。

现有技术中的一种网页主题识别和网页信息抽取的方法主要包括:在网页主题分析的基础上,把网站的所有网页合并为一个虚拟网页,采用词频特征向量进行网站分类。采用向量空间模型,利用向量间的距离进行网站主题分析,采用主题频次向量来描述网站的主题特征,根据网站中所包含每个主题的网页数来相应确定向量元素的权值。此外,网站的内部链接结构常常被视为一种层次性的树或图结构。例如:根据站点的物理与逻辑链接结构来合并网页主题,从而确定网站主题。

然后,利用人工构建的信息抽取系统、有监督的信息抽取系统、半监督的信息抽取系统和无监督的信息抽取系统进行网页信息抽取。

在实现本发明过程中,发明人发现上述现有技术中的网页主题识别和网页信息抽取的方法至少存在如下问题:需要对网站的整体链接结构进行复杂的统计和分析,面对快速增长的网络规模,适用性有待提高。无法快速、准确地识别出新闻视频网站,也无法自动、及时地发现和集成新闻视频。

发明内容

本发明的实施例提供了一种新闻视频的搜索方法和装置,以实现自动、准确和及时地发现和集成新闻视频。

一种新闻视频的搜索方法,包括:

基于语义关联信息构建搜索新闻视频网站的本体知识,利用所述本体知识从互联网中搜索出新闻视频网站;

对所述新闻视频网站进行及时性的评价,利用所述及时性的评估结果设定所述新闻视频网站的抓起时间间隔;

利用所述新闻视频网站的抓起时间间隔,通过设定的搜索方法实时抓起所述新闻视频网站中的内容,获取所述内容中的新闻视频。

一种新闻视频的搜索装置,包括:

新闻视频网站搜索模块,用于基于语义关联信息构建搜索新闻视频网站的本体知识,利用所述本体知识从互联网中搜索出新闻视频网站;

抓起时间间隔设定模块,用于对所述新闻视频网站搜索模块所搜索出来的新闻视频网站进行及时性的评价,利用所述及时性的评估结果设定所述新闻视频网站的抓起时间间隔;

新闻视频获取模块,用于利用所述抓起时间间隔设定模块所设定的新闻视频网站的抓起时间间隔,通过设定的搜索方法实时抓起所述新闻视频网站中的内容,获取所述内容中的新闻视频。

由上述本发明的实施例提供的技术方案可以看出,本发明实施例有效地解决了互联网新闻视频自动、准确、及时的搜索与集成的问题,可以快速、准确地识别出新闻视频网站,可以自动、及时地发现和集成新闻视频。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的一种新闻视频的搜索方法的原理示意图;

图2为本发明实施例一提供的一种新闻视频的搜索方法的处理流程图;

图3为本发明实施例一提供的一种本体知识的构建原理示意图;

图4为本发明实施例一提供的一种网站主题识别方法的处理流程图;

图5为本发明实施例一提供的一种对本体知识进行新链接产生力、主题相关度评价的具体处理流程图;

图6为本发明实施例一提供的一种对新闻视频数据库中存储的新闻视频网站进行及时性评价的处理流程图;

图7为本发明实施例一提供的一种对新闻视频数据库中存储的新闻视频网站进行新颖性评价的处理流程图;

图8为本发明实施例一提供的一种对新闻视频数据库中存储的新闻视频网站进行原创性评价的处理流程图;

图9为本发明实施例一提供的一种基于内容的重复检测技术的处理流程图;

图10为本发明实施例一提供的一种实时抓起新闻视频数据库中存储的新闻视频网站的内容的处理流程图;

图11为本发明实施例二提供的一种新闻视频的搜索装置的结构示意图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010280175.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top