上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 41 下一页
摘要: 安装步骤 步骤一:SFTP 工具上传并解压 azkaban 三个安装包 azkaban-db-3.91.0-184-ge0e7aa7.tar、azkaban-exec-server-3.91.0-184-ge0e7aa7.tar、azkaban-web-server-3.91.0-184-ge0e7 阅读全文
posted @ 2021-06-23 14:56 Binge-和时间做朋友 阅读(734) 评论(0) 推荐(0)
摘要: 什么是任务调度 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python 等。 这些任务需要不同的运行环境,并且除了定时运行,各种类型之间的任 阅读全文
posted @ 2021-06-23 14:55 Binge-和时间做朋友 阅读(8146) 评论(0) 推荐(0)
摘要: 安装包 ambari-2.7.3.0-centos7.tar.gz HDP-3.1.0.0-centos7-rpm.tar.gz HDP-UTILS-1.1.0.22-centos7.tar.gz HDP-GPL-3.1.0.0-centos7-gpl.tar.gz Ambari Ambari 跟 阅读全文
posted @ 2021-06-23 08:56 Binge-和时间做朋友 阅读(2581) 评论(0) 推荐(0)
摘要: Apache Hadoop与CDH、HDP的比较 一、Hadoop版本综述 不收费的 Hadoop 版本主要有三个(均是国外厂商),分别是: Apache(最原始的版本,所有发行版均基于这个版本进行改进) Cloudera版本(Cloudera’s Distribution Including Ap 阅读全文
posted @ 2021-06-22 11:36 Binge-和时间做朋友 阅读(10194) 评论(0) 推荐(2)
摘要: 执行 Kylin 样例 执行 sample.sh 脚本 [root@node-01 ~]# cd /root/apps/kylin-3.1.2/bin [root@node-01 bin]# sample.sh #成功后会有如下提示 Sample cube is created successful 阅读全文
posted @ 2021-06-22 10:14 Binge-和时间做朋友 阅读(262) 评论(0) 推荐(0)
摘要: 环境准备 Hadoop 3.2.1 Hive 3.1.2 HBase 2.2.7 Zookeeper 3.4.6 安装步骤 上传 apache-kylin-3.1.2-bin-hadoop3.tar.gz 安装包并解压 [root@node-01 ~]# tar -xvzf apache-kylin 阅读全文
posted @ 2021-06-22 10:13 Binge-和时间做朋友 阅读(212) 评论(0) 推荐(0)
摘要: 数据仓库(Data Houseware) 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,它用于支持企业或组织的决策分析处理。 数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库 数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有 阅读全文
posted @ 2021-06-22 10:11 Binge-和时间做朋友 阅读(187) 评论(0) 推荐(0)
摘要: Kylin 技术架构图 Kylin 系统可以分为在线查询和离线构建两部分 离线构建 数据源目前主要是 Hadoop、Hive、Kafka和 RDBMS,其中保持着待分析的用户数据 Cube Build Engine(构建引擎)从数据源中抽取数据,并构建 Cube 数据以关系表的形式输入,且必须符合星 阅读全文
posted @ 2021-06-22 10:10 Binge-和时间做朋友 阅读(181) 评论(0) 推荐(0)
摘要: 什么是 Cube 和 Cuboid 给定一个数据模型,我们可以对其上所有维度进行组合。对于 N 个维度来说,有组合的可能性为 2 的 N 次方种。对每一种维度的组合,将度量做聚合运算,运算的结果保存为一个物理视图,称为 Cuboid。 将所有维度组合的 Cuboid 作为一个整体,被称为 Cube。 阅读全文
posted @ 2021-06-22 10:08 Binge-和时间做朋友 阅读(201) 评论(0) 推荐(0)
摘要: 什么是 Kylin 官网:http://kylin.apache.org/cn/ Apache Kylin 是 Hadoop/Spark 大数据平台上的一个开源的联机分析处理(OLAP)引擎 Kylin 采用多维立方体预计算技术,实现了超高速的大数据 OLAP 分析,也就是要让大数据分析像使用数据库 阅读全文
posted @ 2021-06-22 10:06 Binge-和时间做朋友 阅读(403) 评论(0) 推荐(0)
上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 41 下一页