[发明专利]一种基于位置服务采集新浪微博团购信息的方法有效

专利信息
申请号: 201310020773.1 申请日: 2013-01-21
公开(公告)号: CN103117919A 公开(公告)日: 2013-05-22
发明(设计)人: 张卫丰;王云;周国强;张迎周;王子元;周国富;钱小燕;许碧欢;陆柳敏 申请(专利权)人: 南京邮电大学
主分类号: H04L12/58 分类号: H04L12/58;G06F17/30
代理公司: 江苏爱信律师事务所 32241 代理人: 唐小红
地址: 210003 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 位置 服务 采集 新浪 微博团购 信息 方法
【说明书】:

技术领域

发明涉及新浪微博开放平台提供的位置服务接口,通过该接口抽取某一位置附近的所有的微博数据。针对这些微博数据信息,首先利用模式匹配技术进行预处理,再使用语义分析技术优化,最终获取所有团购信息。该方法帮助传统的借助第三方团购网站发布团购信息的商户,直接在微博上发布团购信息。属于数据挖掘领域。

背景技术

微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现实时分享。与传统博客相比,微博最大的优势在于其实时性强,简单易用,多平台。人们可以随时随地发布信息分享自己的动态,同时它对用户的要求也很低,草根性强。

微博开放平台是一个基于新浪微博客系统的开放的信息订阅、分享与交流平台。微博开放平台为您提供了海量的微博信息、粉丝关系、以及随时随地发生的信息裂变式传播渠道。广大开发者或网站只要登录平台网站并创建应用,即可通过平台开放接口(Open API)对微博系统进行读写,挖掘微博系统的新功能与新玩法。 

位置服务,新浪微博“位置服务接口”为第三方提供基于“位置服务”与“兴趣图谱”的多维度位置服务。新浪微博“位置服务平台”一共提供六大类接口,其中普通接口21个,高级接口7个。第三方开发者现在可以通过新浪微博开放平台直接调用以上接口,完成位置应用的基础开发。

随着Internet技术的不断发展,网络技术越来越成熟,电子商务事业蓬勃发展。越来越多的商家和用户在网上交易,而团购在电子商务中崭露头角。团购作为一种新兴的电子商务模式,通过消费者自行组团、专业团购网站、商家组织团购等形式,提升用户与商家的议价能力,并极大程度地获得商品让利,引起消费者及业内厂商、甚至是资本市场关注。从美团、拉手、淘宝聚划算等专门收集团购信息的网站,到淘宝的用户自主组团,以及新浪微博的小米2手机发布抢购,团购成为电子商务不可缺少的一部分。

目前主流的团购信息获取还是通过浏览第三方的团购网站获取,例如美团,拉手网,千品网等大型的团购网站。但随着技术的发展,人们对信息的实时性和位置就近服务要求越来越高。而大型的团购网站虽然搜罗了大量的团购信息,但信息不实时,且要求人要浏览相应网站。微博作为信息交流的平台,实时性高,传播广。尤其是微博的多平台性,既有Web,也有Wap客户端。用户移动终端只要下载了微博客户端即可登录随时发布微博,PC终端只要登录一下新浪微博即可浏览微博。商家用户只需将团购信息发布在微博平台上,客户将不再需要借助第三方团购网站,而只需利用微博客户端即可浏览团购信息。另一方面,新浪微博中有少数团购应用。这些应用只是简单的创建了一个话题收集一下大型团购网站的团购信息,或者做了美团网之类团购网站的手机客户端。应用并没有充分利用微博这一信息交流互动平台,并没有使得商家可以实时发布团购信息,并将信息汇总给用户。因此,开发一种新型的采集团购信息的方法是社会迫切需要的。针对传统方法的不足,提出了一种基于位置服务,采集团购信息的方法。

 

发明内容

技术问题:本发明的目的是提供一种基于位置服务采集新浪微博团购信息的方法。商家用户通过新浪微博平台发布团购信息,利用新浪微博开放的位置服务接口抽取在该位置附近发布的所有的微博数据。同时,将抽取出来的微博数据存放在数据库中,针对微博数据进行语料模式匹配预处理操作;再初步筛选出含团购信息特征的微博数据;接着,使用语义分析技术确定该条数据是否为团购信息;最终,成功地将团购信息从某一位置发布的大量微博数据中采集出来。

技术方案:本发明的一种基于位置服务采集新浪微博团购信息的方法所包含的步骤为:

步骤1) 抽取在某一具体位置附近发布微博的数据集信息:

步骤1.1) 获取申请新浪微博应用的相关信息;

步骤1.2) 分配授权信息;

步骤1.3) 获取用户的该位置信息;

步骤1.4) 根据位置服务的动态信息接口,抽取该位置附近发布的所有微博数据信息;

步骤1.5) 存储抽取的所有微博数据信息;

步骤2) 预处理微博数据集信息:

步骤2.1) 获取微博数据集信息;

步骤2.2) 获取团购语料库;

步骤2.3) 初始化微博数据集中团购的相关信息:

步骤2.3.1) 初始化微博数据集中的团购信息标志为1;

步骤2.3.2) 初始化微博数据集中的团购关键词匹配次数为0;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310020773.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top