摘要: [root@linux ~]# tar [-cxtzjvfpPN] 文件与目录 ....参数:-c :建立一个压缩文件的参数指令(create 的意思);-x :解开一个压缩文件的参数指令!-t :查看 tarfile 里面的文件!特别注意,在参数的下达中, c/x/t 仅能存在一个!不可同时存在! 阅读全文
posted @ 2018-09-13 19:14 知识小书包 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 前言:要学习spark程序开发,建议先学习spark-shell交互式学习,加深对spark程序开发的理解。spark-shell提供了一种学习API的简单方式,以及一个能够进行交互式分析数据的强大工具,可以使用scala编写(scala运行与Java虚拟机可以使用现有的Java库)或使用Pytho 阅读全文
posted @ 2018-09-13 17:26 知识小书包 阅读(12135) 评论(0) 推荐(0) 编辑
摘要: 在Spark中有map和mapPartitions算子,处理数据上,有一些区别 主要区别: map是对rdd中的每一个元素进行操作; mapPartitions则是对rdd中的每个分区的迭代器进行操作 MapPartitions的优点: 如果是普通的map,比如一个partition中有1万条数据。 阅读全文
posted @ 2018-09-13 15:46 知识小书包 阅读(15932) 评论(0) 推荐(0) 编辑