会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
来自东方地灵殿的小提琴手
愿时间能带走痛苦
博客园
首页
新随笔
联系
订阅
管理
2023年4月14日
解密 parquet 文件,以及如何用 Python 去处理它
摘要: 楔子 随着大数据时代的发展,每天都要产生大量的数据,而存储这些数据不仅需要更多的机器,怎么存也是一个问题。因为数据不是存起来就完事了,我们还要对数据进行分析、统计,所以一个合理的数据格式也是非常重要的。 而随着数据种类的不同,我们也会选择不同的格式去存储。 数据种类 数据一般可以分为三种:非结构化数
阅读全文
posted @ 2023-04-14 16:48 古明地盆
阅读(7502)
评论(0)
推荐(1)
公告