书号:978-7-5641-8367-7
书名:流式(影印版)
定价:128.00元
作者:Tyler Akidau, Slava Chernyak, Reuven Lax
出版日期:2019-5
出版社:东南大学出版社
如今,流式数据是大数据中的一个大问题。 随着越来越多的企业试图掌控遍布的无限海量数据集,流式终于到了足以被主流接纳的成熟度。通过这本实用指南,数据工程师、数据科学家和开发人员将学习到如何以概念化和无关于平台的方式处理流式数据。
基于对Tyler Akidau的热门博文《Streaming 101》和
《Streaming 102》的拓展,本书将带你从入门到细致入微地理解实时数据流处理的what、where、when和how。你还将与合著者Slava Chernyak和Reuven Lax一起深入了解水印和exactly-once处理。
你将学习到:
如何比较流式和批量数据处理模式
健全的乱序数据处理背后的核心原理和概念
水印如何在无限数据集中跟踪进度和完整性
exactly-once数据处理技术如何确保正确性
流和表的概念如何构成批量和流式数据处理的基础
用现实世界的例子演示强大的持久状态机制背后的实用动机
时变关系(time-varying relations)如何将流处理和熟悉的SQL及关系代数世界联系起来
“如果你关心流式作业和批处理作业的正确性,那么本书是必读之作。它对该主题所展开的讨论是我迄今为止所见到过的清晰和合理的,同时极好地解释了相关的概念。”
—— Martin Kleppmann
Tyler Akidau是Google的软件工程师,担任着Data Processing Languages & Systems小组技术负责人的职务。他也是Apache Beam PMC的创始成员。
Slava Chernyak是Google的软件工程师。他花了六年时间研究Google内部的大规模流式数据处理。
Reuven Lax是Google的软件工程师,在过去十年间一直在帮助制定Google的数据处理和分析策略,同时他也是Apache Beam PMC的成员。
^_^:f8c4c80f2c1941277ab252bf301d76ba