摘要: Resilient Distributed dataset , 弹性分布式数据集。 分布式内存的抽象使用,实现了以操作本地集合的方式来操作分布式数据集的抽象实现。 RDD是Spark最核心的东西,它表示已被分区,不可变的并能够被并行操作的数据集合,不同的数据集格式对应不同的RDD实现。 RDD必须是 阅读全文
posted @ 2018-12-13 09:18 wqbin 阅读(630) 评论(0) 推荐(0) 编辑
摘要: 问题在哪呢?好久没没有出现类似问题了 解决方案: 之前zookeeper 是可以正常启动的,今天启动zookeeper时报如上错误。经过测试发现: 只要在~/zookeeper/data/ 下删除文件夹version 2 : rm rf version 2 然后就可以正常启动zookeeper了。 阅读全文
posted @ 2018-12-13 08:48 wqbin 阅读(652) 评论(0) 推荐(0) 编辑