会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
纯捡垃圾吃的
张瑞153169
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
21
22
23
24
25
26
下一页
2019年8月30日
大数据云平台Greenplum:多租户篇
摘要: Greenplum 是最出色的开源MPP数据库,经过15年的发展,从数据仓库发展成了云时代的理想大数据平台。 本系列文章将从各个方面介绍Greenplum对云的支持。本篇侧重多租户。 1. 什么是多租户 多租户指一套系统能够支撑多个租户。一个租户通常是具有相似访问模式和权限的一组用户,典型的租户是同
阅读全文
posted @ 2019-08-30 11:25 纯捡垃圾吃的
阅读(1678)
评论(0)
推荐(0)
2019年8月26日
Kafka集成SparkStreaming
摘要: Kafka项目在版本0.8和0.10之间引入了一个新的消费者API,因此有两个独立的相应Spark Streaming包可用。请选择正确的包, 请注意,0.8集成与后来的0.9和0.10代理兼容,但0.10集成与早期的代理不兼容。 注意:从Spark 2.3.0开始,不推荐使用Kafka 0.8支持
阅读全文
posted @ 2019-08-26 11:46 纯捡垃圾吃的
阅读(331)
评论(0)
推荐(0)
2019年8月23日
CDH集群安装出现问题参考
摘要: 一、登录Cloudera Manager (http://192.168.201.128:7180/cmf/login)时,无法访问web页面 针对此问题网上有较多的解决方案(e.g. https://www.cnblogs.com/zlslch/p/7078119.html), 如果还不能解决你的
阅读全文
posted @ 2019-08-23 08:59 纯捡垃圾吃的
阅读(1316)
评论(0)
推荐(0)
Cloudera Manager卸载笔记
摘要: 1、通过管理平台分别停止组件服务和Cloudera Management Service 2、通过管理平台注销并移除Parcles (在控制台注销并移除,无论是安装的Parcles还是未安装的Parcles) 3、停止后台服务 sudo service cloudera-scm-agent stop
阅读全文
posted @ 2019-08-23 08:46 纯捡垃圾吃的
阅读(369)
评论(0)
推荐(0)
2019年8月22日
Hive去除重复数据操作
摘要: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能 hive的元数据存储:通常是存储在关系数据库如 mysql(推荐) , derby(内嵌数据库)中 hive的组成部分 :解释器、编译器、优化器、执行器 hive具有sql数据库的外表,但
阅读全文
posted @ 2019-08-22 17:34 纯捡垃圾吃的
阅读(13971)
评论(0)
推荐(0)
上一页
1
···
21
22
23
24
25
26
下一页
公告
返回顶部