21/7/12 读书笔记 Online Mobile Micro-Task Allocation in Spatial Crowdsourcing & Online Minimum Matching in Real-Time Spatial Data: Experiments and Analysis
21/7/12 读书笔记
Online Mobile Micro-Task Allocation in Spatial Crowdsourcing 阅读总结
前提知识
什么是Spatial Crowdsourcing?
众包(Crowdsourcing)是一种商业行为。有别于传统雇佣关系的商业外包,众包中需求方将工作以自由且自愿的方式外包给大型的大众网络,由供应方自觉自愿地完成需求方所发布的核心工作,同时需求方为用户支付酬劳。而空间众包(Spatial Crowdsourcing)特指需求方发布的请求需要供应方在特定的地点完成任务。广义上来说,外卖、网约车等都属于空间众包项目。由于空间众包的移动性质,其又被称为Mobile crowdsourcing。
本文摘要提取出的信息
- 以往的很多研究基于offline scenarios的前提,其中所有的任务的时间-空间信息以及众包工作人员的信息都在任务分配前给定。这种方式无法符合实际需求,现实生活中的时间-空间信息是无法提前给定的。
- 目前很多研究online scenario的工作致力于最糟糕场景下的性能优化,而实际上最糟糕场景发生概率很低。
- 提出了一个新的场景问题Global Online Micro-task Allocation in spatial crowdsourcing,GOMA,来反映online scenario下随机场景下算法的平均性能。这个问题又被称为online random model。并将online maximum weighted bipartite matching场景中的目前最先进的算法延伸到当前场景下作为baseline。
offline scenario下的spatial crowdsourcing allocation问题可以被归纳到online maximum weighted bipartite matching问题进行解决。因此这里的先进算法指的就是offline scenario下的先进算法。
-
提出了一个两阶段的框架,并在这个框架上展示了\(\frac{1}{4}\)竞争比的Two-phase-based Global Online Allocation, TGOA算法在online random order model下的效果。
-
进一步提出TGOA-Greedy算法,竞争比为\(\frac{1}{8}\)。这个算法比TGOA更快,性能更好。
Summary
一句话总结该工作内容
提出了一种能够在task和worker信息均实时动态变化的场景下高效进行spatial crowdsourcing的task allocation的算法并取得了比offline scenario下最先进算法更好的效果。
Strong Point
总结该工作的三个优点
- 提出的GOMA问题比现有的offline和OMWBM问题更贴近现实需求。
- 所提出的two-phase-based架构能够保持竞争比在global random order model下是一个常量,该架构下提出的TGOA算法能够避免陷入局部最优解。
- 基于online scenario提出来TGOA-Greedy算法,用贪婪策略替代了原搜索策略,降低了随机场景下的竞争比,并且取得了比TGOA在运行时间、内存占用上的优势,且在不同的时间和空间维度具有可伸缩性。
Weak Point
指出工作的三个缺点
- 假设了micro-task的简单性,即任意worker均可以执行,从而使得其成功率等用于其可靠性。
- 假设了不同的micro-task之间的奖励没有明显的区别。
- 定义了Invariable constraint,即worker不能主动放弃task。这不符合实际众包工作的需求。
Reflection
本文对于问题的描述和定义非常清晰明了,对于现有工作的分析和对比非常到位。算法部分看起来实在太艰难了,原因在于我薄弱的数学功底。最终的测试部分非常详尽,几乎覆盖了所有的变量。
Online Minimum Matching in Real-Time Spatial Data: Experiments and Analysis
从本文摘要中提取的信息
Online minimum bipartite matching,OMBM问题定义了一些已知的供应方和未知的动态的需求方,而解决问题的方式就是在总距离最小的情况下找到一个最大量级的匹配,使得任何一个需求方出现时都能立刻匹配到一个能够提供服务的供应方。
本文主要进行了OMBM场景下的代表性算法的测试比较
本文发现其中一种简单的贪婪算法产生了意想不到的结果。这个算法在最糟糕的情况下呈现出指数级的competitive ratio,因此一直被认为是最差的算法。但是在本文中,在平均的情况下进行测试,其竞争比趋近于一个常数3.195。之后本文进一步探讨了该贪婪算法的效率性。
最后,本文对所有OMBM的算法进行了实现并指出了他们各自的优缺点。
Summary
一句话总结该工作内容
本文介绍、测试、对比了OMBM场景下的各种算法,并发现了贪婪算法Greedy在random order model下的测试中拥有更好的性能、更好的可拓展性和更好的更低的competitive ratio。
Strong Point
总结该工作的三个优点
- 提出了随机化的random order model比测试最糟糕情况的 adversary model更加具有实用性
- 发现了Greedy算法在random order model下反常的优越性和其competitive ratio趋近于常值
- 对OMBM下的多种不同类型的算法进行了较为详细的介绍和测试
Weak Point
指出工作的三个缺点
- 没有证明Greedy算法为什么会在random order model下的competitive ratio趋近于3.195这个常数。
- 没有对各个算法的性能差异进行进一步的探索和解释
- 采用的实验平台是2.4GHz的i5搭配4GB内存,性能较差,没有说明其是否符合测试需求。
Reflection
本文在算法介绍时特定按类型进行了分类介绍,使得层次感很强,同时对于2-HST是如何实现问题建模还附加了图来帮助理解;测试时合成数据时采用了四种常规分布,还特定引用了参考文献来说明为什么采用幂分布和指数分布。
本文中我发现了一处笔误,即第二页(期刊1054页)1.2 Contribution中第1段第8行的comparative ratio应该是competitive ratio,一度造成了我的困惑。

浙公网安备 33010602011771号