摘要: 前言 该文章中将会整理一些大数据中常见的文件格式及压缩算法的理论知识,作为后期实践的理论指导。理论+实践才会更方便用这些文件格式和压缩算法。 目前hadoop中常见的文件格式有textfile、sequencefile、avro、rcfile、orcfile、parquet等,上述六种文件格式又可以 阅读全文
posted @ 2022-08-20 15:09 踩坑臭皮匠 阅读(1262) 评论(0) 推荐(0)