[发明专利]基于最大似然比的群智数据有效性验证方法在审
| 申请号: | 201410568300.X | 申请日: | 2014-10-22 |
| 公开(公告)号: | CN104462187A | 公开(公告)日: | 2015-03-25 |
| 发明(设计)人: | 闻于天;张奇;田晓华;杨峰;王新兵 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 最大 数据 有效性 验证 方法 | ||
技术领域
本发明涉及通信技术领域,具体地,涉及一种基于最大似然比的群智数据有效性验证方法。
背景技术
群智(crowdsourcing)在智能手机的应用中有十分广阔的前景。随着互联网技术的飞速发展,网络中个体的数量飞速增长,个体相互之间的联系也越来越紧密。在这样的大环境下,群智服务应运而生。如何有效的构建群智服务平台,促进社会中的资源共享,是下一代互联网研究需要解决的重要问题。
如今,信息提供商往往采用群智激励机制(Crowdsourcing Incentive Mechanism),将采集信息的工作交由分散的用户来做,并为他们提供的信息或服务给予一定的回报。例如有人想知道某段道路的拥堵情况,由正在该路段上的用户提供的信息不仅比提供商派人去勘察得到的信息更快也更准确。如今手机传感技术(Mobile Phone Sensing)正在蓬勃的发展之中,多种多样的传感设备正在被安装到智能手机上,例如加速传感器,GPS,距离传感器,相机等。利用这些分散的用户的智能手机传感技术获取到所需的信息并上传给提供商是现阶段逐渐流行的手段。
尽管群智有众多优点,但是其弊端也是不可避免的。由于数据的测量者没有经过专业训练,测量的数据的观测误差总体来说会比较大,而且,由于测量者未经训练,不同数据的有效性的差异也会比通过传统方法获得的数据更大。极端情况下,如果测量者对测试对象非常陌生,甚至误操作,导致数据严重偏离了正常水平,采用这个数据将会对样本的有效性造成一定损害。
这是群智场景中特有的一种误差,以下称为观测误差;其余的称为测量误差。这两种误差通常都可以用更大的样本量来弥补,但是我们的目的在于通过概率论的方法对群智数据进行定量评价与比较。进一步地,目的在于能从中筛选出相对有效性更高的一部分,也就是观测误差较小的一部分。
经过对现有技术文献的检索发现,M.Ramadan等2008年在International Symposium on Personal,Indoor and Mobile Radio Communications发表的“Implementation and evaluation of cooperative video streaming for mobile devices”中提出了基于合作下载的视频分享机制,但该机制要求所有参与用户都相互认识并主动组成无线局域网,因而应用场景受到了极大限制。L.Keller等2012年在International Conference on Mobile Systems,Applications,and Services发表的“MicroCast:cooperative video streaming on smartphones”中提出了一种利用手机之间无线通信实现的视频协作下载加速机制。但该机制要求所有参与用户都希望下载同一个视频,该条件在大部分情况下都得不到满足,因而有很大的局限性。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于最大似然比的群智数据有效性验证方法,通过利用服务器数据库中已经积累的大量数据内容更好地筛选有效的数据,减少录入错误数据造成的判断偏差。
根据本发明提供的一种基于最大似然比的群智数据有效性验证方法,包括如下步骤:
步骤1:实验获取先验概率plj,其中,plj表示对于某个观测分量j,一个未经训练的测量者将该观测分量j判断为l的概率;
步骤2:服务器对已经积累的所有数据按观测值归类;对同一测量值j的所有数据,使用核密度估计计算概率密度函数,计算置信概率αj;
步骤3:服务器等待用户上传新的数据;
步骤4:测量者i使用其移动终端进行多次测量,获得一组数据,这组数据连同测量者自己观察得到的观测分量一同上传给服务器;
步骤5:服务器将用户提供的数据与数据库相比较,计算这组数据的似然可靠度;
步骤6:服务器决定是否接受这组数据,根据可靠性支付报酬;如果服务器接受这组数据,返回步骤2,更新这个测量值j的数据库,重新使用步骤2中的方法计算概率密度函数和置信概率αj。
优选地,所述步骤1包括如下步骤:
步骤1.1:对于基于Wi-Fi信号强度的室内定位的训练过程中,测量者需要确定自已所处室内的位置,产生观测误差;测量者的观测误差被抽象为其处于房间中一点时对于房间最近的两个墙壁的距离的估计误差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410568300.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防止网络爬虫死锁的资源配置方法
- 下一篇:一种记录数据更新方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





