数据和资料相比有非常不同的特性:价值高度依赖新颖性和精确性,仅由产生它的上下文决定。另一方面,它能被自由复制且不需要成本。因此,它不能被看成有内在价值的资源,这是大多数博弈论的关注点。
相反,本书相信数据博弈论应关注产生新颖、精确数据的激励机制,本书把此类观点的近期工作汇集在了一起。
本书介绍了可用于这种激励的各种机制。从可验证信息的激励机制开始展示,真实数据(ground truth)用作激励的基础。本书大多数内容是关于更难的不可验证信息的激励问题的,真实数据永远不可知。事实证明,即便在这种情况下,博弈论能提供激励,使得提供精确和 真实信息的贡献者获得最大利益。
本书也考虑在有些场景下,智能体主要想通过它们提供的数据来影响学习算法的结果,这里面就有无视货币奖励的恶意智能体。书中将展示如何限制个体数据提供者对学习结果的负面影响,以及如何阻止恶意的报告。
不过本书的主要目标是使读者理解构造激励机制的原理,最后以分析几种必须要考虑的特征来结束,它们集成在了一个实际的分布式机器学习系统中。
本书是写作时处在发展中的这个领域的一个快照,希望它能激发更多研究者的兴趣。