[发明专利]一种软文广告投放的监测方法及装置有效
申请号: | 201710923272.2 | 申请日: | 2017-09-30 |
公开(公告)号: | CN109598530B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 贺达 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 党丽;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 投放 监测 方法 装置 | ||
本发明提供一种一种软文广告投放的监测方法及装置,按照配置信息中的软文投放页上级网址爬取网页数据,所述配置信息包括软文投放页网址及与其相对应的软文投放页上级网址、软文内容;爬取结果中获取与软文投放页地址一致的数据信息,所述数据信息包括网页内容;判断所述网页内容是否与配置信息中与软文投放网址相对应的软文内容是否一致,若一致,则认为软文投放页被正常投放。本发明按照配置信息通过爬虫爬取与软文投放页相关的网页数据,而后通过对爬取结果进行解析,判断软文投放页是否被正常投放,可以根据需要随时启动监测,无需人工监测,即可随时获得软文广告的投放情况。
技术领域
本发明涉及互联网技术领域,特别涉及一种软文广告投放的监测方法及装置。
背景技术
随着互联网的高速发展,互联网上传播的数据和信息也越来越丰富,逐渐成为人们获取信息的重要途径,同时,也成为各类广告商投放广告的重要途径。
软文广告是相对于硬性广告而言的,是一种“文字广告”,其将宣传内容与文章结合在一起,让读者在阅读文章的同时,了解到所要宣传的东西,软文广告的投放主要集中在浏览量大、曝光率高的各大咨询网站或门户网站等。在广告主投放了软文广告之后,广告主需要知道软文广告的投放情况,以便于衡量广告投放的效果。目前,主要通过广告商提供报表的形式,向广告主反馈软文广告的投放情况,而广告主难以一一进行核实,无法随时获得软文广告的投放情况。
发明内容
本发明旨在至少解决上述问题之一,提供一种软文广告投放的监测方法,可以随时获得软文广告的投放情况。
为实现上述目的,本发明有如下技术方案:
一种软文广告投放的监测方法,包括:
按照配置信息中的软文投放页上级网址爬取网页数据得到爬取结果,所述配置信息包括软文投放页网址及与其相对应的软文投放页上级网址、软文内容;
从所述爬取结果中获取与软文投放页网址一致的数据信息,所述数据信息包括网页内容;
判断所述网页内容与所述配置信息中的软文内容是否一致,若一致,则认为软文投放页被正常投放。
可选地,所述配置信息还包括与软文投放页网址相对应的投放时段,所述数据信息还包括所述网页内容对应的上级网址以及爬取时间;则,
在判断所述网页内容与所述配置信息中的软文内容是否一致的步骤中,还包括:
判断所述网页内容对应的上级网址是否与所述配置信息中的软文投放页上级网址相一致;
判断所述爬取时间的时段是否与所述配置信息中的投放时段相一致。
可选地,所述按照配置信息中的软文投放页上级网址爬取网页数据得到爬取结果,包括:
在预设时间点或者以预设的时间频率,按照配置信息中的软文投放页上级网址爬取网页数据得到爬取结果。
可选地,所述判断所述网页内容与所述配置信息中的软文内容是否一致,包括:
若所述软文内容为文本格式,则通过相似文章判断算法,判断所述网页内容与配置信息中的软文内容是否一致;
若所述软文内容为图片格式,则通过光学字符识别技术对所述软文内容中的文字进行识别,而后,通过相似文章判断算法,判断识别后的网页内容与配置信息的软文内容是否一致。
一种软文广告投放的监测装置,包括:
爬取单元,用于按照配置信息中的软文投放页上级网址爬取网页数据,所述配置信息包括软文投放页网址及与其相对应的软文投放页上级网址、软文内容;
数据信息获取单元,用于从爬取结果中获取与软文投放页地址一致的数据信息,所述数据信息包括网页内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710923272.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户标识的识别方法及装置
- 下一篇:一种监测代码的生成方法及验证方法