打赏
摘要: 不多说,直接上干货! DataFrame的推出,让Spark具备了处理大规模结构化数据的能力,不仅比原有的RDD转化方式更加简单易用,而且获得了更高的计算性能。Spark能够轻松实现从MySQL到DataFrame的转化,并且支持SQL查询。 图 DataFrame与RDD的区别 从上面的图中可以看 阅读全文
posted @ 2017-04-10 22:06 大数据和AI躺过的坑 阅读(3635) 评论(0) 推荐(0)
摘要: Spark SQL基本原理 1、Spark SQL模块划分 2、Spark SQL架构--catalyst设计图 3、Spark SQL运行架构 4、Hive兼容性 1、Spark SQL模块划分 Spark SQL模块划分为Core、caralyst、hive和hive- ThriftServer 阅读全文
posted @ 2017-04-10 21:59 大数据和AI躺过的坑 阅读(9178) 评论(0) 推荐(1)