scala combineByKey用法说明
摘要:语法是: combineByKey[C]( createCombiner: V => C, mergeValue: (C, V) => C, mergeCombiners: (C, C) => C ) 标记一下:(因为有很多同样的字母,方便说明我就按照字母+数字标记一下) 语法说明:(不复制网上的,
阅读全文
posted @
2018-09-29 12:50
一只猪儿虫
阅读(556)
推荐(0)
spark 中如何查看单个RDD分区的内容(创建分区,查看分区数)
摘要:spark 创建分区 val scores = Array(("Fred", 88), ("Fred", 95), ("Fred", 91), ("Wilma", 93), ("Wilma", 95), ("Wilma", 98)) val input = sc.parallelize(scores
阅读全文
posted @
2018-09-29 11:53
一只猪儿虫
阅读(1345)
推荐(0)
scalac:cannot connnect to compile server(idea 编译scala)
摘要:idea编译scala报错 解决办法: File->setting->scala compile server (找到jdk填上 ok)
阅读全文
posted @
2018-09-15 15:11
一只猪儿虫
阅读(1242)
推荐(0)
Exception message: /bin/bash: line 0: fg: no job control
摘要:这个错误是 我本地idea 远程调试hadoop集群出现的 Diagnostics: Exception from container-launch. Container id: container_1536891254067_0001_02_000001 Exit code: 1 Exceptio
阅读全文
posted @
2018-09-14 12:06
一只猪儿虫
阅读(1878)
推荐(0)
Error: java.lang.NullPointerException at outputformat.MysqlOutputFormat.getRecordWriter(MysqlOutputFormat.java:27)
摘要:Error: java.lang.NullPointerException at outputformat.MysqlOutputFormat.getRecordWriter(MysqlOutputFormat.java:27) at org.apache.hadoop.mapred.ReduceT
阅读全文
posted @
2018-09-12 12:00
一只猪儿虫
阅读(476)
推荐(0)
hbase集群中其中某个regionserver 没有启动
摘要:第一步: date命令查看各个机器的时间 发现linux02机器时间差了2个多小时 第二步:ntpdate pool.ntp.org 修改错误时间的机器 第三步: 重启 hbase
阅读全文
posted @
2018-09-11 15:14
一只猪儿虫
阅读(1013)
推荐(0)