会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dummyly
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
下一页
2018年11月28日
spark的flatMap和map区别
摘要: map()是将函数用于RDD中的每个元素,将返回值构成新的RDD。 flatmap()是将函数应用于RDD中的每个元素,将返回的迭代器的所有内容构成新的RDD,这样就得到了一个由各列表中的元素组成的RDD,而不是一个列表组成的RDD。 新建person.txt: 1 lisi 182 liwu 20
阅读全文
posted @ 2018-11-28 15:56 dummyly
阅读(502)
评论(0)
推荐(0)
2018年11月23日
HDFS上传文件
摘要: 1.client端向namenode请求上传文件,查看文件是否存在,是否有权限往hdfs写入 2.如果文件不存在,权限OK就根据副本数N(例如2个),根据网络拓扑选择N个离client端最近的datanode返回client。 (把文件切块,一个一个block块的请求namenode,返回最优的da
阅读全文
posted @ 2018-11-23 23:30 dummyly
阅读(1062)
评论(0)
推荐(0)
SparkStreaming和Kafka的整合
摘要: 当我们正确地部署好Spark Streaming,我们就可以使用Spark Streaming提供的零数据丢失机制。需要满足以下几个先决条件: 1、输入的数据来自可靠的数据源和可靠的接收器; 2、应用程序的metadata被application的driver持久化了(checkpointed );
阅读全文
posted @ 2018-11-23 15:42 dummyly
阅读(687)
评论(0)
推荐(0)
hadoop ha集群搭建
摘要: 集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master、slave01、slave02 Hadoop HA集群搭建(高可用): 设置静态IP地址 为普通用户添加sudo权限 服务器网络设置:NAT
阅读全文
posted @ 2018-11-23 11:45 dummyly
阅读(339)
评论(0)
推荐(0)
Zookeeper安装
摘要: 版本 zookeeper-3.4.8 下载 zookeeper-3.4.8.tar.gz 通过SFTP上传到master 解压 tar -zxvf zookeeper-3.4.8.tar.gz -C /home/dummy/app 配置环境变量 vi ~/.bash_profile source ~
阅读全文
posted @ 2018-11-23 11:15 dummyly
阅读(478)
评论(0)
推荐(0)
hadoop完全分布式集群的搭建
摘要: 集群配置: jdk1.8.0_161 hadoop-2.6.1 linux系统环境:Centos6.5 创建普通用户 dummy 准备三台虚拟机master,slave01,slave02 hadoop完全分布式集群的搭建: 设置静态IP地址 为普通用户添加sudo权限 服务器网络设置:NAT模式
阅读全文
posted @ 2018-11-23 10:09 dummyly
阅读(1505)
评论(0)
推荐(0)
hadoop伪分布式集群的搭建
摘要: 集群配置: jdk1.8.0_161 hadoop-2.6.1 linux系统环境:Centos6.5 创建普通用户 dummy 设置静态IP地址 Hadoop伪分布式集群搭建: 为普通用户添加sudo权限: 设置之前必须得安装sudo,先su 输入密码进入root用户,执行 yum install
阅读全文
posted @ 2018-11-23 01:11 dummyly
阅读(509)
评论(0)
推荐(0)
2018年11月22日
Linux基本命令运行
摘要: 文件基本操作: 增删查改: 创建文件:touch(创建文件和修改文件或者目录的时间戳),vim、vi(编辑/创建文件),mkdir(创建文件目录) 移动和修改文件名:mv 删除文件:rm –rf(强制递归删除) 复制文件:cp 复制目录加-R,R表示recursive,具体可以查看man cp 退回
阅读全文
posted @ 2018-11-22 23:27 dummyly
阅读(1760)
评论(0)
推荐(0)
关于spark入门报错 java.io.FileNotFoundException: File file:/home/dummy/spark_log/file1.txt does not exist
摘要: 不想看废话的可以直接拉到最底看总结 废话开始: master: master主机存在文件,却报 执行spark-shell语句: ./spark-shell --master spark://master:7077 --executor-memory 1G --total-executor-core
阅读全文
posted @ 2018-11-22 13:02 dummyly
阅读(5562)
评论(0)
推荐(1)
2018年5月20日
解决maven项目Invalid bound statement (not found)的方法
摘要: 用IDEA 做的ssm 的maven项目,登陆时出现上图问题。 原因是它读取不到DevUserMapper.xml文件和取它xml文件,后面查询在编译好的文件中,xml文件并没有引入进来,这就是导致出现这个问题的原因。 解决方法: 在pom.xml文件中的<build>标签中添加以下代码:
阅读全文
posted @ 2018-05-20 15:44 dummyly
阅读(478)
评论(0)
推荐(0)
上一页
1
2
3
4
5
下一页
公告