会员
周边
众包
新闻
博问
闪存
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
TheEarthOnTheFly
博客园
首页
新随笔
联系
管理
订阅
2018年9月4日
if (assertnotnull(input[0, org.apache.spark.sql.Row, true]).isNullAt) null else staticinvoke(class o...
摘要: 运行spark程序一直报错: 原因: 文件里有一行数据为垃圾数据, 这行数据的列数和列名的个数不一致. 解决办法: 过滤掉这样的数据
阅读全文
posted @ 2018-09-04 14:18 TheEarthOnTheFly
阅读(470)
评论(0)
推荐(0)
2018年5月23日
Hadoop 文件夹大小统计
摘要: Hadoop 文件夹大小统计 https://blog.csdn.net/mtj66/article/details/52648483
阅读全文
posted @ 2018-05-23 16:49 TheEarthOnTheFly
阅读(331)
评论(0)
推荐(0)
2018年5月17日
hadoop fs 命令详解
摘要: 转载: https://blog.csdn.net/bgk083/article/details/49454209
阅读全文
posted @ 2018-05-17 11:28 TheEarthOnTheFly
阅读(1046)
评论(0)
推荐(0)
2018年5月15日
Spark在windows7环境下的搭建
摘要: 看到一位大牛总结的: ♣ Spark在windows7环境下的搭建: https://blog.csdn.net/u011513853/article/details/52865076 ♣ 用IDEA创建第一个Maven项目, scala项目, scala插件安装: https://blog.csd
阅读全文
posted @ 2018-05-15 16:54 TheEarthOnTheFly
阅读(208)
评论(0)
推荐(0)
Shell脚本注意点
摘要: 1 #!/bin/bash 2 3 procPath="jar包的路径" 4 hdfsdir="hdfs://主节点hostname:端口号" 5 6 # 日期文件执行 7 proctime=$(date +%Y%m%d -d "-2 day") 8 lasttime=$(date +%Y%m%d
阅读全文
posted @ 2018-05-15 16:35 TheEarthOnTheFly
阅读(166)
评论(0)
推荐(0)
crontab定时任务, 定时到秒
摘要: crontab定时任务最小支持到minute, 定时到秒执行的任务, 写起来比较麻烦 * * * * * /bin/sh /home/jiewang/portraitProc/test.sh >> /home/jiewang/portraitProc/test.txt 2>&1 /bin/sh 任何
阅读全文
posted @ 2018-05-15 16:33 TheEarthOnTheFly
阅读(2036)
评论(0)
推荐(0)
crontab定时任务, 执行shell脚本, 报错: hadoop not found, spark not found
摘要: 权限问题 在shell脚本最前面添加下面内容: #hadoop export PATH=$PATH:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/home/user/
阅读全文
posted @ 2018-05-15 16:22 TheEarthOnTheFly
阅读(667)
评论(0)
推荐(0)
2018年1月25日
Windows7下设置定时启动(关闭)虚拟机
摘要: Windows7下设置定时启动(关闭)虚拟机
阅读全文
posted @ 2018-01-25 23:05 TheEarthOnTheFly
阅读(1656)
评论(1)
推荐(1)
Windows7下远程操作虚拟机
摘要: 远程操作虚拟机
阅读全文
posted @ 2018-01-25 22:11 TheEarthOnTheFly
阅读(980)
评论(1)
推荐(1)
公告