摘要:
Delta Lake 重点问题 Delta Lake API 支持哪种类型的写操作? Delta Lake 可以解决哪些需求? 快点清理掉被合并掉的小文件,如何设置安全期参数 什么是 Delta Lake 整体来看的话,其实就是在数据入hdfs之前多了delta lake这层组件,能够对小文件合并, 阅读全文
摘要:
Spark for ETL & Data Science 重点问题 Zeppelin 支持哪些引擎 Zeppelin支持Spark的哪些运行模式 What is ETL & Data Science How to do ETL in Spark **E: Extract → **Read raw d 阅读全文
摘要:
Linux Python 换源 for Linux sudo mkdir ~/.pip vim ~/.pip/pip.conf 在pip.conf文件中输入以下内容即可: [global] index-url = http://pypi.douban.com/simple [install] use 阅读全文