随笔分类 -  大数据

摘要:1.Spark Streaming功能介绍 1)定义 Spark Streaming is an extension of the core Spark API that enables scalable, high-throughput, fault-tolerant stream process 阅读全文
posted @ 2019-04-30 15:31 子墨言良 阅读(632) 评论(0) 推荐(0)
摘要:1.Spark SQL概述 1)Spark SQL是Spark核心功能的一部分,是在2014年4月份Spark1.0版本时发布的。 ​ 2)Spark SQL可以直接运行SQL或者HiveQL语句 ​ 3)BI工具通过JDBC连接SparkSQL查询数据 ​ 4)Spark SQL支持Python、 阅读全文
posted @ 2019-04-28 17:08 子墨言良 阅读(2849) 评论(0) 推荐(0)
摘要:1.Hue 概述及版本下载 1)概述 Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行 阅读全文
posted @ 2019-04-15 17:31 子墨言良 阅读(667) 评论(0) 推荐(0)