全局压缩(一般不用,容易和sqoop产生冲突)
算法类型
算法默认是defaultCode 或者snappy(推介这两种)
局部压缩的步骤方式
开启压缩模式
使用压缩算法,这里是查看压缩算法写法类似
插入数据会用此压缩方式
存储格式用成RCFile
改变格式和压缩方式后到hadoop fs -text不能查看数据内容(除了textfile无压缩格式)
最佳压缩方式是defaultCode + rcFile