[发明专利]一种微信数据获取方法和系统有效

专利信息
申请号: 201510363826.9 申请日: 2015-06-26
公开(公告)号: CN105162676B 公开(公告)日: 2017-08-11
发明(设计)人: 沙灜;包秀国;程工;陈学敏;贺敏;梁棋;马宏远;王卿;庞琳;李雄;刘玮 申请(专利权)人: 中国科学院信息工程研究所;国家计算机网络与信息安全管理中心
主分类号: H04L12/58 分类号: H04L12/58;H04L29/08
代理公司: 北京君尚知识产权代理事务所(普通合伙)11200 代理人: 冯艺东
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 获取 方法 系统
【说明书】:

技术领域

发明涉及社交网络数据采集领域,涉及一种微信数据获取方法和系统,具体涉及基于安卓平台应用测试组件和浏览器测试组件相结合的微信数据获取方法和系统。

背景技术

据统计,中国手机用户超过9亿,截至2011年12月底,中国网民规模达到3.56亿,智能手机网民达1.9亿,同时随着3G时代的到来和智能手机的普及,使用智能手机上网的用户数量呈现出超过使用电脑上网的用户数量的明显趋势。结合快速的3G/4G网络,手机具有高速度、多媒体、个性化的特点,成为人们随身携带便于沟通的交互式工具。

Web2.0技术下的信息传播由于网络的聚合作用而大大加强,促进了新的媒介生态环境的出现。媒体信息也从传统平台转战新媒体,媒体信息发布者对网络和手机的利用也无所不用其极,手机短信、手机微博等媒体信息处处可见。基于手机即时通讯(IM)的媒体信息传播还处于起步发展阶段,但是已经被诸多媒体以及组织个人等关注。

2011年1月21日,腾讯正式推出基于QQ用户的微信。这款通过网络快速发送语音短信、视频、图片和文字,支持多人群聊的手机聊天软件,使用户可以通过微信与好友进行形式上更加丰富的类似于短信、彩信等方式的联系。微信可以说是介于手机QQ和微博之间的第三种社交关系,它正在改变着人们的社交生活方式。在累计经过40多个版本升级后,微信自身形成了一个三维沟通矩阵:X坐标是语音、文字、图片、视频;Y坐标是手机通讯录、智能手机客户端、QQ、微博、邮箱;Z坐标是LBS定位、漂流瓶、摇一摇、二维码识别。纵横交错立体化的社交链,覆盖了工作、生活的多层次需求面,并且在这个三维空间里,各沟通链条完全交叉、各平台互通共享,这是其他IM工具所无法比拟的。

现在面向微信平台的数据获取技术主要有:(1)人工破解客户端,包括通信协议破解,能够快速获取数据,但是同时客户端破解需要较强的逆向工程技术,同时伴随微信版本升级,其安全机制不断升级,存在失效的可能性。破解难度较大,成本过高。(2)Web协议模拟,通过抓包等方式分析网页版微信的通信协议,通过协议模拟达到数据获取的目的,但是从长期实用角度考虑,伴随微信版本升级,存在协议升级改动,协议模拟失效的可能性,长期维护投入成本较大。同时,此方法无法避开人工二维码扫描登陆,在大规模数据采集环境下,需要额外频繁的人工开销。

由于传统的对社交网络数据获取的技术主要是面向PC端社交网络媒体的数据采集,而微信仅提供移动设备平台的客户端和包含基本聊天功能的web方式(其中macOSX平台微信客户端为web方式封装,功能仅包括基本聊天功能),所以对于用户历史消息和资料等信息以及长远考虑更多的消息的获取只能从微信移动设备端出发。

综上,微信由于其安全机制及其本身生态圈的封闭性,对于微信客户端的破解或通信协议的破解成本投入过大且伴随版本升级破解成果难以确保长久有效。

发明内容

为了实现面向微信平台的数据获取,同时保证其数据的相对完整性以及即时性,此外考虑到避免纯网页版获取方式的人工操作,本发明提出了一种微信数据获取方法和系统,通过安卓平台应用测试组件和浏览器测试组件相结合来实现。

需要说明的是,安卓平台应用测试组件最初是面向安卓平台app的自动化功能测试,通过安卓开放的接口实现安卓控件的定位和操作。因为app应用可解析为不同控件组成的树状结构。而浏览器测试组件最初面向桌面浏览器的自动化功能测试或压力测试。

为了实现上述目的,本发明通过以下技术方案来实现:

一种微信数据获取方法,是通过将安卓平台应用测试组件和浏览器测试组件相结合分别获取微信非即时数据和即时数据实现的。

考虑到单个app只能同时操作一个界面,故微信非即时数据和即时数据的获取是分别进行的。

获取微信非即时数据包括以下步骤:

1-1)通过任务分配调度机制获取目标公众账号(即欲获取数据的微信公共账号),并进行关注。

1-2)通过安卓平台应用测试组件模拟用户行为操作微信客户端,进入公众账号资料界面,获取账号资料信息。

1-3)由微信公众账号资料界面进入历史消息界面,点击转发,选择发送给朋友,随机选择任意好友,进入确认转发界面,通过定位转发界面的安卓控件,提取历史消息页面地址。

1-4)通过浏览器测试组件打开步骤1-3)提取的历史消息页面地址,加载后获得相应的页面消息数据。

1-5)将上述历史消息页面地址和相应的页面消息数据进行分析和请求链接拼接,获取该微信公众账号所有历史消息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所;国家计算机网络与信息安全管理中心,未经中国科学院信息工程研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510363826.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top