摘要: 1. 背景描述和需求 数据分析程序部署在Docker中,有一些分析计算需要使用Spark计算,需要把任务提交到Spark集群计算。 接收程序部署在Docker中,主机不在Hadoop集群上。与Spark集群网络互通。 需求如下 1、在Docker中可程序化向Spark集群提交任务 2、在Docker 阅读全文
posted @ 2020-07-03 18:08 MyStitch 阅读(2174) 评论(0) 推荐(0) 编辑
摘要: Spark 版本配套表 名称 版本 说明 Spark spark-2.3.0-bin-hadoop2.7 Spark mongo-java-driver-3.5.0.jar 3.5 Mongo驱动 mongo-spark-connector_2.11-2.3.1.jar 2.3 Mongo conn 阅读全文
posted @ 2020-07-03 17:46 MyStitch 阅读(3191) 评论(0) 推荐(0) 编辑
摘要: HDFS 文件操作命令 注,其实常用命令不用网上搜,和linux下的命令很类似,触类旁通,直接在linux 上 hadoop fs 看一下就行了,不需要刻意去记 我把 linux 上的 help 列举下,方便直接看吧,hdfs dfs 与 hadoop fs 效果一样 常用的就是 hdfs dfs 阅读全文
posted @ 2020-07-03 17:20 MyStitch 阅读(524) 评论(0) 推荐(0) 编辑