随笔分类 -  大数据

摘要:JStorm的Metrics含义 附录:Metrics含义 MemoryUsed cluster/topology/worker使用到的物理内存HeapMemory cluster/topology/worker JVM使用到的堆内存CpuUsedRatio cluster/topology/wor 阅读全文

posted @ 2021-10-28 10:52 深圳私塾

摘要:大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的; 大数据,首先你要能存的下大数据。传统的文件系统是单机的,不能横跨不同的机器。HDFS(Hadoop Distributed FileSystem)的设计本质上是为了大量的数据能横跨成百上 阅读全文

posted @ 2019-06-24 17:36 深圳私塾 阅读(236) 评论(0) 推荐(0)

摘要:文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 GlusterFS 是一个集群的文件系统,支持PB级的数据量 阅读全文

posted @ 2018-11-26 15:40 深圳私塾 阅读(104) 评论(0) 推荐(0)

导航