随笔分类 - 大数据
摘要:## 源码地址:[GitHub - apache/dolphinscheduler at 3.1.7-release](https://github.com/apache/dolphinscheduler/tree/3.1.7-release) ## 个人fork gitee地址:[DolphinS
        阅读全文
                
摘要:# DolphinScheduler3.1.7 ## DolphinScheduler简介 Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。 Apache D
        阅读全文
                
摘要:[TOC] # altas2.1.0编译、安装、集成CDH6.3.2 参考链接1:[http://t.csdn.cn/TOS4q](https://blog.csdn.net/h952520296/article/details/110874432) 参考链接2:[数据治理之元数据管理的利器——At
        阅读全文
                
摘要:# ranger2.1.0源码编译以及安装 ## 编译环境准备 | 环境需求 | 示例版本 | | | | | JDK8 | Java(TM) SE Runtime Environment (build 1.8.0_231-b11) | | maven3.5 | 3.10.0-957.el7.x86
        阅读全文
                
摘要:# 离线CDH集群自动化部署工具 离线CDH集群安装与部署的自动化脚本工具,简单支持「**离线一键装机**」。 **脚本将对系统配置做出一定修改,使用前请务必确认当前服务器无其他人员、任务使用,以免造成不必要的麻烦,建议提前使用测试服务器或虚拟机测试体验。** ## 一、Features 已实现的自
        阅读全文
                
摘要:# **Cloudera_Manager_6.3.2**安装配置文档 ## 1. 配置准备 Cloudera Manager (简称CM)用于管理CDH6集群,可进行节点安装、配置、服务配置等,提供Web窗口界面提高了Hadoop配置可见度,而且降低了集群参数设置的复杂度。 本次CM安装配置规划如下
        阅读全文
                
摘要:# HDFS small file merge # 1.hive ## Settings There are 3 settings that should be configured before archiving is used. (Example values are shown.) ``` 
        阅读全文
                
摘要:# kafka eagle 安装文档 ``` 环境介绍 :kafka 三台 版本:2.2.1+cdh6.3.2 管理:ZK ``` ## kafka-eagle-bin-2.0.5.tar.gz安装包准备 ``` 官网 :http://download.kafka-eagle.org/ 百度云链接:
        阅读全文
                
摘要:小白终于进入了职场,从事大数据方面的工作! 分到项目组了,搬砖的时候遇到了一个这样的问题。 要求:用spark实现oracle的存储过程中计算部分。 坑:由于报表中包含了一个ID字段,其要求是不同的区域拥有不同的区域ID,且ID在数据库表中的属性为主键。Oracle的存储过程中采用的是自定义序列,采
        阅读全文
                
摘要:Hive的安装和使用 我们的版本约定: JAVA_HOME=/usr/local /jdk1.8.0_191 HADOOP_HOME=/usr/local/hadoop HIVE_HOME=/usr/local/hive 离线安装Mysql 1°、查看mysql的依赖 rpm -qa | grep 
        阅读全文
                
摘要:Spark分布式安装 Spark安装注意:需要和本机的hadoop版本对应 前往spark选择自己相对应的版本下载之后进行解压 命令:tar –zxf spark-2.4.0-bin-hadoop2.6.tgz –C /usr/local 配置spark分布式,修改两个主要配置文件 spark-en
        阅读全文
                
摘要:基于hadoop集群搭建zookeeper集群 Filezilla上传zookeeper压缩包到主节点 安装zookeeper到/usr/local目录 命令:tar –zxf zookeeper3.4.tar.gz /usr/local 更名命令: mv zookeeper3.4 zookeepe
        阅读全文
                
摘要:日志______2019.1.24 Hbase分布式搭建 注意:hbase的使用基于hadoop,开启以及关闭需要注意顺序,由于我是的是自带的zookeeper,说以开启关闭顺序应如下 启动:hadoop>>hbase 关闭:hbase>>Hadoop 相关命令: start-all.sh开启had
        阅读全文
                
摘要:日志_____2019.1.23 实验集群环境搭建 三台阿里云服务器 公网ip 内网ip 120.79.63.130 node2 172.17.17.58 112.74.50.240 主节点master 172.17.17.79 39.108.232.147 node1 172.16.50.183 
        阅读全文
                
                    
                
浙公网安备 33010602011771号