[发明专利]用于设计数据市场实验的方法和系统在审
| 申请号: | 201380071867.X | 申请日: | 2013-12-16 |
| 公开(公告)号: | CN105074737A | 公开(公告)日: | 2015-11-18 |
| 发明(设计)人: | 斯特拉蒂斯·约安尼季斯;蒂保·Y·霍雷尔 | 申请(专利权)人: | 汤姆逊许可公司 |
| 主分类号: | G06Q10/00 | 分类号: | G06Q10/00 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周泉 |
| 地址: | 法国伊西*** | 国省代码: | 法国;FR |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 设计 数据 市场 实验 方法 系统 | ||
相关申请的交叉参考
本申请要求享有于2013年1月31日递交申请的美国临时申请No.61/759203的权益,其全部内容通过引用方式并入本文。
技术领域
本发明原理涉及用于设计数据市场实验的装置和方法。
背景技术
在实验设计领域,实验者可能接触到n个潜在实验受试者的群体。每个受试者与实验者已知的特征集合(例如性别、年龄、体重、职业)相关联。实验者希望做测量受试者的某个内在性质的实验,例如他们点击广告、感染疾病或有高血压的可能性。在做实验之前,受试者的结果对于实验者来说是未知的,但是往往实验者具有对用户特征和输出之间的关系的假设,并希望通过实验来加以验证。进行实验并获得测量使实验者确定这一假设的正确性。
上述实验设计情景具有许多应用,包括医学测试、市场调研、在线调查以及其他。在本文的描述中,假设实验不能被操纵,因此认为测量结果是可靠的。然而,存在与对每一个受试者进行实验相关联的成本,该成本对于不同的受试者有所不同。可以将此成本视为当测试受试者时招致的并且需要为受试者补偿的成本;或者,可以将其视为对受试者参与实验的激励;或者,可以将其视为数据的内在价值。
存在许多已知估计程序以及用于量化所产生的估计的质量的方法。还存在关于在实验者仅可进行有限数量的实验的情况下如何选择受试者的广泛理论,所以估计过程返回近似基本群体的真实参数。本文描述的原理通过在战略背景下审视实验设计并且通过研究机制设计问题(例如激励用户针对他们的数据报告真实值)而偏离此传统方案。
实验者往往使用严格的预算,但往往受试者是战略性的,这意味着他们可能具有谎报自己的期望补偿以企图使他们的金钱利益最大化的动机。从战略性角度对这个问题的原则性研究以前尚未为人所熟知。
预算可行机制设计最初是在第一种现有技术方法中提出的。这种方法考虑使在价值查询模型中服从预算限制的任意子模函数最大化的问题,即假设提供关于任何给定集合的子模目标的价值的oracle。第一种现有技术方法表明,存在用于子模最大化的普遍真实的随机化的112近似机制(即,它是从在真实机制上的分布取样的随机化的机制)。第二种现有技术方法通过提供7.91近似机制来改善这一结果,并且在用于子模最大化的普遍真实的机制中显示对应的下限2。与上述结果相反,对于子模最大化,目前还没有听说过在多项式时间中运行的任何真实、恒定近似机制。本发明原理解决在确定用于实验的受试者集合和补偿时激励潜在受试者准确报告自己的期望补偿的问题。
发明内容
通过本发明原理解决现有技术的这些和其他缺点和劣势,本发明原理针对用于设计数据市场的方法和装置。本发明原理提供具有预算的实验者可以在其中设计具有受试者的实验的方法,每一个受试者具有成本,使得基于受试者对实验的价值和他们的成本将他们添加到实验。
根据本发明原理的一个方面,提供了一种方法,用于:访问至少一个受试者的特征的向量,包括所述至少一个受试者参与实验的成本;接收描述将为实验花费的成本的预算;计算所述受试者集合中的每个成员对实验的价值,以确定所述集合的最高价值成员并且将这个成员添加到实验;对所述集合中除所述集合的最高价值成员以外的受试者执行凸优化,以确定阈值;将所述阈值与所计算的价值进行比较,以确定所计算的价值是否超过所述阈值,并且如果所计算的价值超过所述阈值,则使用全部预算给所述至少一个受试者指派补偿,并且如果所计算的价值不超过所述阈值,则按照被添加到实验的受试者对实验的价值的边际贡献的增加的顺序将预算的部分按比例指派给他们,直到预算用完。
根据本发明原理的另一个方面,提供了一种装置,该装置包括用于从集合中选择受试者用于实验的一个或多个处理器,所述一个或多个处理器共同配置为:访问至少一个受试者的特征的向量,包括所述至少一个受试者参与实验的成本;接收描述将为实验花费的成本的预算;计算所述受试者集合中的每个成员对实验的价值,以确定所述集合的最高价值成员并且将这个成员添加到实验;对所述集合中除所述集合的最高价值成员以外的受试者执行凸优化,以确定阈值;将所述阈值与所计算的价值进行比较,以确定所计算的价值是否超过所述阈值;并且如果所计算的价值超过所述阈值,则使用全部预算给所述至少一个受试者指派补偿,并且如果所计算的价值不超过所述阈值,则按照被添加到实验的受试者对实验的价值的边际贡献的增加的顺序将预算的部分按比例指派给他们,直到预算用完。
结合附图阅读示例性实施例的以下详细描述,本发明原理的这些和其他方面、特征和优点将变得显而易见。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380071867.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





