[发明专利]一种网页连接识别方法、装置及存储介质有效

专利信息
申请号: 201910743292.0 申请日: 2019-08-13
公开(公告)号: CN112395527B 公开(公告)日: 2022-07-08
发明(设计)人: 汪景福;吴晶晶;万明月;冯少伟 申请(专利权)人: 腾讯科技(武汉)有限公司
主分类号: G06F16/957 分类号: G06F16/957;G06F16/44
代理公司: 深圳翼盛智成知识产权事务所(普通合伙) 44300 代理人: 黄威
地址: 430000 湖北省武*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网页 连接 识别 方法 装置 存储 介质
【说明书】:

发明实施例公开了一种网页连接识别方法、装置及存储介质,应用于信息处理技术领域。网页连接识别装置会根据目标多媒体的信息及多媒体站点的信息,获取多媒体站点提供的基于目标多媒体的网页中,待识别的网页连接接口的结构布局信息,并提取结构布局信息的第一特征信息,最后再根据第一特征信息及预置的特征模型,对待识别的网页连接接口中用于展示目标多媒体的网页连接接口进行识别。这样通过网页连接接口的结构布局信息的第一特征信息与预置的特征模型,即可识别出特定网页中,用于展示目标多媒体的网页连接接口,实践证明,本发明实施例的识别方法的识别准确较高。

技术领域

本发明涉及信息处理技术领域,特别涉及一种网页连接识别方法、装置及存储介质。

背景技术

通常视频终端显示的视频界面中可以包括多个基于视频的网页连接接口,这样,当用户操作某一网页连接接口时,视频终端会根据相应的网页地址信息显示相应的视频网页。因此,在视频界面的详情信息中会包括多个网页连接接口分别对应的网页地址信息,比如,该视频界面中特定视频的统一资源定位符(Uniform Resource Locator,URL),与特定视频相关的推荐视频的URL,热门视频的URL及导航URL等,这样,可以从这些网页地址信息中识别出特定视频的的网页地址信息,进而对各个网站提供的特定视频进行监控。

现有的一种网页连接识别方法,主要是将视频界面中的各个网页连接接口的信息进行关键词匹配,比如,将视频界面对应的URL所在的a标签中的文本内容与预置关键词进行匹配,其中预置关键词可以为“第n集”、“高清”或“立即播放”等。但是,这种方式很容易出现误匹配和漏匹配的问题。

现有的另一种网页连接识别方法,主要是采用机器分类器从多个网页地址信息中识别出特定视频的网页地址信息,这种方法识别的准确率较高,但是,需要事先对大量的样本进行人工标注,并通过标注后的样本训练机器分类器,这样,人工成本过高。

发明内容

本发明实施例提供一种网页连接识别方法、装置及存储介质,实现了根据网页连接接口的结构布局信息的第一特征信息进行识别用于展示目标多媒体的网页连接接口。

本发明实施例第一方面提供一种网页连接识别方法,包括:

获取目标多媒体的信息及多媒体站点的信息;

根据所述获取的信息,获取所述多媒体站点提供的基于所述目标多媒体的网页中,待识别的网页连接接口的结构布局信息;

提取所述结构布局信息的第一特征信息;

根据所述第一特征信息及预置的特征模型,对所述待识别的网页连接接口中用于展示所述目标多媒体的网页连接接口进行识别,所述预置的特征模型包括所述多媒体站点提供的基于目标多媒体的网页中用于展示所述目标多媒体的网页连接接口的特征。

本发明实施例第二方面提供一种网页连接识别装置,包括:

信息获取单元,用于获取目标多媒体的信息及多媒体站点的信息;

布局获取单元,用于根据所述获取的信息,获取所述多媒体站点提供的基于所述目标多媒体的网页中,待识别的网页连接接口的结构布局信息;

特征提取单元,用于提取所述结构布局信息的第一特征信息;

识别单元,用于根据所述第一特征信息及预置的特征模型,对所述待识别的网页连接接口中用于展示所述目标多媒体的网页连接接口进行识别,所述预置的特征模型包括所述多媒体站点提供的基于目标多媒体的网页中用于展示所述目标多媒体的网页连接接口的特征。

本发明实施例第三方面提供一种存储介质,包括:所述存储介质储存多条指令,所述指令适于由处理器加载并执行如本发明实施例第一方面所述的网页连接识别方法。

本发明实施例第四方面提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(武汉)有限公司,未经腾讯科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910743292.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top