摘要: 数据导入有如下几种方式: 1.利用HBase提供的ImportTsv将csv文件导入到HBase (舍弃) 2.利用HBase提供的completebulkload将数据导入到HBase 3.利用HBase提供的Import将数据导入到HBase(舍弃) 实际生产环境上很难使用命令行的方式。毕竟源数 阅读全文
posted @ 2018-04-30 18:50 Dlimeng 阅读(11) 评论(0) 推荐(0)
摘要: spark源码系列03-任务提交01:https://blog.csdn.net/qq_19968255/article/details/82803794 12. DAGScheduler getShuffleMapStage 创建父Stage val stage =newOrUsedStage(… 阅读全文
posted @ 2018-04-30 18:08 Dlimeng 阅读(8) 评论(0) 推荐(0)
摘要: url: spark源码系列03-任务提交01 12. DAGScheduler getShuffleMapStage 创建父Stage val stage =newOrUsedStage(…… 13. DAGScheduler newOrUsedStage 递归 val stage = newSt 阅读全文
posted @ 2018-04-30 18:08 Dlimeng 阅读(8) 评论(0) 推荐(0)
摘要: 用spark版本1.3+ val conf=new SparkConf().setAppName("WordCount") val sc=new SparkContext(conf) //构建RDD并调用Transformation //textFile创建一个hadoopRdd,产生一个MapPa 阅读全文
posted @ 2018-04-30 17:46 Dlimeng 阅读(9) 评论(0) 推荐(0)