06 2015 档案
摘要:由于Hadoop的MapReduce和HDFS都有通信的需求,所以需要对通信的对象进行序列化. Hadoop并没有采用Java的序列化,而是引入了它自己的序列化系统.org.apache.hadoop.io包中定义了大量的可序列化对象,这些对象都实现了 Writable 接口. Writable 接...
阅读全文
摘要:要存点货啊, 潜心研究技术Hadoop主要包括如下组成部分:Hadoop Core:一些支持hadoop其它子项目的通用工具集 (新版本改为 Hadoop Common)HDFS:一个高容错性的分布式文件系统,用于存储数据MapReduce:一个处理大数据集的分布式计算框架图1-1 是Hadoop项...
阅读全文
摘要:1. 批量删除空文件(大小等于0的文件)find . -name "*" -type f -size 0c | xargs -n 1 rm -f2. 删除指定size大小文件find . -name "*" -type f -size 1024c | xargs -n 1 rm -fps: 此处即删...
阅读全文
摘要:环境: ubuntu hadoop-2.6.0 hive-1.1.01 sudo apt-get install liblzo2-dev hadoop@idex140:~/modules/hadoop-2.6.0$ dpkg -L liblzo2-2 (查看安装包的位置)/./usr/usr/l...
阅读全文
浙公网安备 33010602011771号