摘要: 个人认为在MapReduce中使用Avro可以提升数据的处理性能,主要是以下几点: 向Job提供数据文件时可以使用Avro序列化过的二进制数据文件 在数据解析方面速度比较快 排序功能 Avro官网也提供了一个ColorCount这样的一个案例,演示使用Avro序列化过的二进制数据文件作为MapRed 阅读全文
posted @ 2020-02-07 01:24 杭州胡欣 阅读(504) 评论(0) 推荐(0) 编辑