07 2020 档案
摘要:Spark Streamin...
阅读全文
摘要:Spark Streaming是构建在Spark Core基础之上的流处理框架,是Spark非常重要的组成部分。Spark Stre...
阅读全文
摘要:在《第二篇|Spark Core编程指南》一文中,对Spark的核心模块进行了讲解。本文将讨论Spark的另外一个重要模块–Spar...
阅读全文
摘要:在《第一篇|Spark概览》一文中,对Spark的整体面貌进行了阐述。本文将深入探究Spark的核心组件–Spark core,Sp...
阅读全文
摘要:Apache Spark最初在2009年诞生于美国加州大学伯克利分校的APM实验室,并于2010年开源,如今是Apache软件基金会...
阅读全文
摘要:20世纪80年代末期,数据仓库技术兴起。自Ralph Kimball 于1996 年首次出版The Data Warehouse ...
阅读全文
摘要:无论是数仓开发还是数据分析,写一手好的SQL是一项基本的技能。毋庸置疑,编写性能较好的SQL是非常重要的,但是,SQL的可读性同样...
阅读全文
摘要:控制器组件(Controller),是 Apache Kafka 的核心组件。它的主要作用是在 Apache ZooKeeper 的...
阅读全文
摘要:Kafka有两个很重要的配置参数,acks与min.insync.replicas.其中acks是producer的配置参数,mi...
阅读全文