摘要: 前言 作为一个数据工程师,最喜欢的事情就是不停的在现实的服务端环境调试代码的参数。我们在本地的环境与生产的状况决然不同,我们一开始在本地写代码测试再部署到服务端的三板斧就不适用了。 最好的方式可以直接在linux环境下的服务端直接写代码,分步调试。之前我在银行都是使用集成在CDSW的环境IDE,但是 阅读全文
posted @ 2019-12-06 17:49 wqbin 阅读(11300) 评论(1) 推荐(3)
摘要: kill这个残留进程然后直接重新启动airflow webserver就OK (wqbin) rdev@testhk1:~/etl/py_etl/warehouse$ cat /home/rdev/airflow/airflow-webserver.pid 22603 (wqbin) rdev@te 阅读全文
posted @ 2019-12-06 14:02 wqbin 阅读(1541) 评论(0) 推荐(0)
摘要: 作为一个IT从业不满三年的菜鸟,可能写类似总结性的文章还是比较费力,但是我还是想尝试写一篇比较出色总结,那么我讲从数据调度N个方面依次详细讲述ETL调度问题。 回答内容如下: 1.什么是数据调度 2.数据调度的 3.数仓调度的工具 crontab quartz airflow azkaban ozi 阅读全文
posted @ 2019-12-06 11:15 wqbin 阅读(721) 评论(0) 推荐(0)