[发明专利]一种网络信息传播效果的监测方法及装置在审
| 申请号: | 201710663796.2 | 申请日: | 2017-08-06 |
| 公开(公告)号: | CN109388740A | 公开(公告)日: | 2019-02-26 |
| 发明(设计)人: | 宣静 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02 |
| 代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
| 地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标文本 文本 目标文本信息 网络信息传播 爬虫 预置参数 传播 预置 监测 文本数据处理 获取目标 检索网络 评估结果 网络爬虫 网络信息 正文信息 自动跟踪 网络 可视化 配置的 浏览器 维度 评估 分析 | ||
1.一种网络信息传播效果的监测方法,其特征在于,所述方法包括:
获取目标文本;
检索网络中与所述目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
通过预置爬虫爬取所述相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
利用所述预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
2.根据权利要求1所述的方法,其特征在于,所述检索网络中与所述目标文本相似的相似文本包括:
获取网络中的文本信息;
在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本;
在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本。
3.根据权利要求2所述的方法,其特征在于,所述获取网络中的文本信息包括:
利用网络爬虫爬取网络中文本格式的数据信息,并解析所述数据信息进行结构化保存,得到第一检索文本信息,所述结构化保存包括存储所述数据信息的标题、正文、链接地址、来源信息;
利用至少一个搜索引擎搜索所述目标文本的标题信息,得到结构化保存的第二检索文本信息;
将所述第一检索文本信息与第二检索文本信息进行合并去重处理,得到用于检索的文本信息。
4.根据权利要求2或3所述的方法,其特征在于,在所述文本信息中筛选含有所述目标文本中的预置关键词的筛选文本包括:
从所述目标文本中确定多个预置关键词;
逐一判断所述文本信息中是否含有所述多个预置关键词;
若含有,则将所述文本信息确定为所述筛选文本。
5.根据权利要求2或3所述的方法,其特征在于,在所述筛选文本中匹配出包含所述目标文本中的预置句子的相似文本包括:
从所述目标文本中确定多个预置句子;
逐一判断所述筛选文本中含有与所述多个预置句子相同的句子的数量;
若所述数量大于阈值,则将所述筛选文本确定为所述相似文本。
6.根据权利要求1-3中任一项所述的方法,其特征在于,所述通过预置爬虫爬取所述相似文本的预置参数信息包括:
根据所述预置爬虫的配置信息确定爬取位置与所述预置参数信息的对应关系;
利用所述预置爬虫获取在所述相似文本中所述爬取位置对应的数据信息;
将所述数据信息确定为所述预置参数信息,所述预置参数信息包含评论数、阅读数、点赞数以及评论内容中的至少一种。
7.根据权利要求3所述的方法,其特征在于,利用所述预置参数信息在至少一个维度中进行分析包括:
确定各个维度中用于计算所述评估结果的所述相似文本中的结构化信息和/或预置参数信息;
确定用于计算所述评估结果的维度数量以及维度信息;
基于所述维度数量以及维度信息计算所述目标文本在网络中传播效果的评估结果。
8.一种网络信息传播效果的监测装置,其特征在于,所述装置包括:
获取单元,用于获取目标文本;
检索单元,用于检索网络中与所述获取单元获取的目标文本相似的相似文本,所述相似文本是指与所述目标文本的正文信息相同或者基于所述目标文本在预定范围内修改得到的文本;
爬取单元,用于通过预置爬虫爬取所述检索单元得到的相似文本的预置参数信息,所述预置爬虫是具有可视化配置的基于浏览器核心的网络爬虫;
分析单元,用于利用所述爬取单元爬取的预置参数信息在至少一个维度中进行分析,得到所述目标文本在网络中传播效果的评估结果。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的网络信息传播效果的监测方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求7中任意一项所述的网络信息传播效果的监测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710663796.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多媒体资源的推荐方法及装置
- 下一篇:一种金融信息的推送方法和装置





