会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
土豆啊你个马铃薯
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
spark
pyspark操作hive分区表以及.gz.parquet和part-00000文件压缩问题
摘要:@ pyspark 操作hive表 pyspark 操作hive表,hive分区表动态写入;最近发现spark动态写入hive分区,和saveAsTable存表方式相比,文件压缩比大约 4:1。针对该问题整理了 spark 操作hive表的几种方式。 1> saveAsTable写入 saveAsT
阅读全文
posted @
2021-08-25 10:52
土豆啊你个马铃薯
阅读(895)
评论(0)
推荐(0)
公告