05 2022 档案
摘要:1.HDFS的产生背景 数据量的增多,需要有一种系统管理多台机器的文件,于是产生DFS(Distributed File System) 2.HDFS简介 Hadoop项目的核心之一,用于数据存储,HDFS基于GFS开源实现。 3.HDFS优点 ·处理超大文件--MB到TB级(相对应的它不适用于存储
阅读全文
摘要:将spark文件上传到Linux并解压缩,使用的版本是spark-3.0.0-bin-hadoop3.2.tgz tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /kkb/softcd /kkb/softmv spark-3.0.0-bin-hadoop3.2
阅读全文

浙公网安备 33010602011771号