摘要:
网上相关文章较少, 得到了一些结论:1 . 无法满足数据仓库调度对于数据体系依赖分析及元数据管理相关要求,故不能作为数据仓库的主要使用方式.2. hbase主要海量数据的存储,hive比较适合数据仓库分析相关大数据时代的争议:Spark 能替代 Hive 吗? 阅读全文
posted @ 2020-06-01 21:23
bitbitbyte
阅读(453)
评论(0)
推荐(0)
摘要:
rdd.mapPartitions与Dstream.transform需要返回值RDD, 是转换算子(存在重复计算的问题)rdd.foreachPartion与Dstream.foreachRDD不需要返回值, 是行动算子注意:如果没有缓存, 没调用一次行动算子, 都会对涉及到的转换算子计算一次. 阅读全文
posted @ 2020-06-01 10:39
bitbitbyte
阅读(288)
评论(0)
推荐(0)
浙公网安备 33010602011771号