摘要: Hadoop是什么?1)Hadoop是一个分布式计算平台,程序员可以在不需要知道底层结构的情况下实现集群并行运算;2)Hadoop不只是一个软件或者系统,它代表的是一个生态圈,一个做大数据分析计算的生态圈。3)Hadoop核心是HDFS和MapReduce。HDFS(Hadoop Distribut... 阅读全文
posted @ 2015-10-05 18:43 Jerry_Chen 阅读(205) 评论(0) 推荐(0)
摘要: 今天开始学习Hadoop这门热门的数据库技术。直接从被奉为Hadoop圣经的《Hadoop The Definitive Guide 4th Edition》入手。第一章作者写到一个关于分布型数据库系统在处理数据分割时的两种方法:1)按照某个单位(诸如年份或者数值范围);2)均匀分割所有数据到若干份... 阅读全文
posted @ 2015-10-05 13:29 Jerry_Chen 阅读(1549) 评论(0) 推荐(0)