摘要: 前言 列式文件,顾名思义就是按列存储到文件,和行式存储文件对应。保证了一列在一个文件中是连续的。下面从parquet常见术语,核心schema和文件结构来深入理解。最后通过java api完成write和read。 术语 block parquet层面和row group是一个意思 row grou 阅读全文
posted @ 2017-12-05 09:14 ulysses_you 阅读(9346) 评论(0) 推荐(0)