随笔分类 -  大数据

大数据相关的概念、技术
摘要:前言接触Hadoop有两年的时间了,期间遇到很多的问题,既有经典的NameNode和JobTracker内存溢出故障,也有HDFS存储小文件问题,既有任务调度问题,也有MapReduce性能问题.遇到的这些问题有些是Hadoop自身的缺陷(短板),有些则是使用的不当。本文基于 Cloudera CD... 阅读全文
posted @ 2015-03-25 15:15 技无止境 阅读(240) 评论(0) 推荐(0)
摘要:转自http://www.cnblogs.com/ggjucheng/archive/2012/04/17/2454590.html获取默认配置配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空... 阅读全文
posted @ 2015-03-23 13:34 技无止境 阅读(175) 评论(0) 推荐(0)
摘要:微博的诞生、云计算、物联网、移动互联网等各种爆炸式数据,给商业智能的蓬勃发展提供了良好的“大数据”环境。大数据为BI带来了海量数据。对挖掘来说,大数据量要更容易对比.抢夺大数据市场,需要具备一定的实力,报表的呈现和简易分析只是停留在“B”的阶段,要想达到“I”的阶段,必须要结合整个大环境、大行业的数... 阅读全文
posted @ 2014-05-23 15:33 技无止境 阅读(838) 评论(0) 推荐(0)