Fork me on GitHub
摘要:一 原理阐述 1' DFS 分布式文件系统(即DFS,Distributed File System),指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。该系统架构于网络之上,势必会引入网络编程的复杂性,因此分布式文件系统比普通磁盘文件系统更为复杂。 2' HDF 阅读全文
posted @ 2017-08-05 18:54 sunwengang 阅读(1352) 评论(0) 推荐(1) 编辑
摘要:一 概述 就像我们所了解的sql一样,Hive也是一种数据仓库,不同的是hive是在hadoop大数据生态圈中所用。这篇博客我主要介绍Hive的简单表运用。 Hive是Hadoop 大数据生态圈中的数据仓库,其提供以表格的方式来组织与管理HDFS上的数据、以类SQL的方式来操作表格里的数据。 Hiv 阅读全文
posted @ 2017-08-05 17:59 sunwengang 阅读(325) 评论(0) 推荐(0) 编辑