文章分类 -  书籍

摘要:13. 学习shell script 阅读全文
posted @ 2018-02-23 14:41 桃源仙居 阅读(103) 评论(0) 推荐(0)
摘要:初识Hadoop 数据量大 存储分析:硬件故障问题(副本),数据共享分析问题 Hadoop:提供可靠的共享存储和分析系统,HDFS实现数据存储,MapReduce实现数据的分析和处理 MapReduce与传统关系型数据库的比较 关于MapReduce Hadoop分布式文件系统 Hadoop的IO操 阅读全文
posted @ 2018-02-22 13:02 桃源仙居 阅读(71) 评论(0) 推荐(0)
摘要:前言: Spark是发源于美国加州大学伯克利分校AMPLab的大数据分析平台, 它立足于内存计算,从多迭代批量处理出发,兼顾数据仓库、 流处理和图计算等多种计算范式,是大数据系统领域的全栈计算平台。 Spark当下已成为Apache基金会的顶级开源项目,拥有庞大的社区支持,技术也逐渐走向成熟 在Sp 阅读全文
posted @ 2017-12-15 14:40 桃源仙居 阅读(145) 评论(0) 推荐(0)