首页
新闻
博问
专区
闪存
班级
我的博客
我的园子
账号设置
退出登录
注册
登录
哥不是小萝莉
博客园
首页
新随笔
联系
订阅
管理
随笔 - 145
文章 - 0
评论 - 433
2019年2月24日
Flink生成Parquet格式文件实战
摘要:1.概述 在流数据应用场景中,往往会通过Flink消费Kafka中的数据,然后将这些数据进行结构化到HDFS上,再通过Hive加载这些文件供后续业务分析。今天笔者为大家分析如何使用Flink消费Kafka的数据后,将消费后的数据结构化到Hive数据仓库中。 2.内容 Hive能够识别很多类型的文件,
阅读全文
posted @ 2019-02-24 16:47 哥不是小萝莉
阅读(6862)
评论(3)
推荐(2)
编辑