会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一首简单的歌
博客园
首页
新随笔
联系
订阅
管理
2022年1月4日
spark 实现HDFS小文件合并
摘要: 一、首先使用sparksql读取需要合并的数据。当然有两种情况, 一种是读取全部数据,即需要合并所有小文件。 第二种是合并部分数据,比如只查询某一天的数据,只合并某一个天分区下的小文件。 val df: DataFrame = spark.sql("sql") 二、将读取到的数据写入临时文件中。此处
阅读全文
posted @ 2022-01-04 22:20 一首简单的歌
阅读(2021)
评论(0)
推荐(0)
公告