随笔分类 - 大数据技术之Hadoop3.x
摘要:HDFS HDFS概述 Hadoop Distributed File System 一种统一管理多个节点上的文件的分布式系统。 使用场景:适合一次写入,多次读出的场景,且不支持文件修改。适合用来做数据分析,并不适合做网盘应用。 HDFS优点 1)高容错性 数据自动保存多个副本。它通过增加副本的形式
阅读全文
摘要:Hadoop概述 Hadoop起源 Google三篇论文 GFS->HDFS MapReduce->MR<stype> BigTable->HBase Hadoop三大发行版本 Apache Hadoop 官网地址:http://hadoop.apache.org/releases.html 下载地
阅读全文