2020 年 4月随笔档案 - 黎明踏浪号

linux下添加hadoop用户

摘要：在linux下安装hadoop后，通常会创建一个专门的hadoop用户以运行hadoop，具体步骤如下 1：创建huser用户sudo useradd -m huser 2：设置用户huser的登录密码 sudo passwd huser 3：给用户huser增加管理员权限 sudo adduser 阅读全文

posted @ 2020-04-15 19:24 黎明踏浪号阅读(2649) 评论(0) 推荐(0)

Window 10 WSL 下hadoop 伪分布式安装

摘要：Window 10 下的WSL子系统的安装可以参考之前的文章：window10 WSL子系统上设置redis开发环境有时候，为了在window系统上进行hadoop开发和测试，可以在WSL上安装hadoop的伪分布式系统因为子系统使用的是ubuntu 18.04，所以下面的安装以此为参考下面是阅读全文

posted @ 2020-04-15 17:15 黎明踏浪号阅读(1797) 评论(0) 推荐(0)

Window 10下spark shell使用sparksql 时的 “entry in command string: null ls -F C:\tmp\hive”问题解决

摘要：很多情况下，我们在window平台下用spark shell来进行交互式开发和测试，当在使用sparksql时，比如如下命令： val myDF = spark.sql("select * from mytable") 可能会遇到下面的问题：这是因为，spark在window平台读取hdfs时，需阅读全文

posted @ 2020-04-10 17:10 黎明踏浪号阅读(1238) 评论(1) 推荐(0)

spark数据怎样输出到Sql Server

摘要：spark数据处理完后，如果结果需要输出到sql database，可以使用spark sql dataframe并引入微软的数据库jdbc驱动输出数据，具体步骤如下： 1：引入微软的jdbc jar包在项目的pom文件加入下面的依赖： <dependency> <groupId>com.micr 阅读全文

posted @ 2020-04-10 10:53 黎明踏浪号阅读(1449) 评论(0) 推荐(0)

spark standalone集群模式下一个启动问题的解决

摘要：spark standalone集群配置好后，启动sbin/start-all.sh报错，其中一个worker没有正常启动起来，查看此worker上的spark\logs目录下的 log文件，有显示如下的错误 20/04/01 02:46:08 WARN Utils: Service 'sparkW 阅读全文

posted @ 2020-04-01 16:19 黎明踏浪号阅读(2110) 评论(0) 推荐(0)

黎明踏浪

04 2020 档案

公告