组件版本
| 大数据组件 | 版本 | 备注 |
|---|---|---|
| Hadoop/Yarn | 2.7.7 | |
| Hive | 1.2.1 | |
| Spark | 2.2.1 | |
| Clickhouse | 20.11.3.3 | |
| Zeppelin | 0.8.1 | |
| scala | 2.11.12 | |
| hadoop-mysql | 5.7.25 | mysql-5.7.25-linux-glibc2.12-x86_64 |
| jdk | 1.8.0_131 | |
| zookeeper | 3.6.2 | |
| knox | 1.6.1 | 安全 |
Atlas
作用: 记录并展示Hive表字段含义,以及表和字段之间的数据血缘关系。
局限: 依赖HBase和solr。
Azkaban
作用: 实现任务流执行,满足任务间依赖关系。
局限: 任务能添加依赖的任务,但是不能传参数,任务流中任意一条路线断了,不能这条路线重启执行。
| 其他组件 | 版本 | 备注 |
|---|---|---|
| Clickhouse | 20.11.3.3 | |
| PostgreSQL | 11.9 | |
| Zeppelin | 0.8.1 | |
| kafka | 2.5.0 | |
| flink | 1.12.1 | flink-1.12.0-bin-scala_2.11 |
| scala | 2.11.12 | |
| jdk | 1.8.0_131 | |
| mongodb | 4.4.4 | |
| mysql | 5.7.18 | |
| milvus | 0.10.5 | |
| datax | ETL工具 python2.7 | |
| docker | 19.03.0 |

浙公网安备 33010602011771号