文章分类 - hadoop
摘要:Hive 压缩方式介绍与使用 1. 引言 在大数据生态系统中,Apache Hive 是一个常用的数据仓库工具。由于 Hive 处理的数据量通常非常庞大,数据压缩显得至关重要。压缩不仅可以显著减少存储空间,还能降低 I/O 开销,从而加快数据传输和查询处理速度。然而,不同的压缩算法在压缩比、CPU
阅读全文
摘要:一、介绍 一句话介绍:用于HDFS DataNode单节点内多个数据盘数据均衡。 官网介绍如下: Diskbalancer is a command line tool that distributes data evenly on all disks of a datanode. This too
阅读全文

浙公网安备 33010602011771号