parquet【yetdone】
摘要:典型场景:Spark SQL、Presto 等 OLAP 引擎的首选格式,适合海量数据的交互式分析。 Block (hdfs block): 指 hdfs 文件系统的 block,parquet 是在 hdfs 文件之上的数据组织格式;(当然现在很多对象存储系统,比如 S3,也支持 parquet
阅读全文
posted @ 2025-07-21 00:11
posted @ 2025-07-21 00:11
posted @ 2025-07-21 00:09