会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
On Big Data
'Where must we go... we who wander this Wasteland in search of our better selves?' -The First History Man
首页
新随笔
联系
订阅
管理
上一页
1
2
3
2015年7月9日
Spark RDD在saveAsTextFile时直接保存成一个txt文件
摘要: 在该语句之前加上repartition(1),即写作以下形式:rdd.repartition(1).saveAsTextFile("out.txt")即,之前每个partition保存成一个txt文件,现repartition成一个分区,然后再保存。注意(未验证):这个操作对于大文件来说,repar...
阅读全文
posted @ 2015-07-09 10:21 gOOner黑骑士
阅读(7958)
评论(0)
推荐(0)
2015年4月13日
Spark单机编译(on CentOS 6)
摘要: 注:1. 编译Spark之前,需要搭建Java和Scala环境,参见http://www.cnblogs.com/kevingu/p/4418779.html。 2. Spark之前使用sbt进行编译,现在建议使用maven并兼容sbt,但会逐步淘汰sbt编译方式。本文使用Maven工具编译Spar...
阅读全文
posted @ 2015-04-13 11:02 gOOner黑骑士
阅读(488)
评论(0)
推荐(0)
2015年4月11日
Scala环境搭建(on CentOS 6)
摘要: 一、安装JDK注:Scala运行在JVM之上,需要安装JDK作为前提,并选择版本为1.7.*,与Scala 2.10.*版本兼容性较好1. 下载:从http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-18802...
阅读全文
posted @ 2015-04-11 23:47 gOOner黑骑士
阅读(1011)
评论(0)
推荐(0)
上一页
1
2
3
公告