随笔分类 -  Kylin

摘要:Kylin 上手 根据Kylin 官方给出的测试数据,我们实际操作一下 Kylin。 1. 导入 Hive 数据 首先创建一个project,在界面左上角有个“Add Project” 按钮,这里我们创建的Project名为tuto。 进入Model 界面,从 Hive 中导入两张表:kylin_s 阅读全文
posted @ 2020-04-21 21:48 ZacksTang 阅读(1590) 评论(0) 推荐(0)
摘要:EMR上搭建kylin 1. 启动EMR集群 根据官网说明: http://kylin.apache.org/docs21/install/kylin_aws_emr.html 启动EMR时,若是 hbase 数据存储在 s3 ,则需指定以下配置: [ { "Classification": "hb 阅读全文
posted @ 2020-04-21 21:39 ZacksTang 阅读(674) 评论(0) 推荐(0)
摘要:1. 传统大数据分析的问题 在基于Hadoop 生态的传统大数据分析中,主要使用的技术是MPP(Massively Parallel Processing)大规模并行处理和列式存储。MPP使用线性增加计算资源换取计算时间的线性下降,列式存储可以提高读取数据的速率。两者结合可以使得基于 Hadoop 阅读全文
posted @ 2020-04-18 22:31 ZacksTang 阅读(884) 评论(0) 推荐(0)