上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 14 下一页
摘要: 一、生产者发送消息的过程 首先介绍一下 Kafka 生产者发送消息的过程: Kafka 会将发送消息包装为 ProducerRecord 对象, ProducerRecord 对象包含了目标主题和要发送的内容,同时还可以指定键和分区。在发送 ProducerRecord 对象前,生产者会先把键和值对 阅读全文
posted @ 2020-06-24 17:00 数据驱动 阅读(354) 评论(0) 推荐(0) 编辑
摘要: 一、Zookeeper集群搭建 为保证集群高可用,Zookeeper 集群的节点数最好是奇数,最少有三个节点,所以这里搭建一个三个节点的集群。 1.1 下载 & 解压 下载对应版本 Zookeeper,这里我下载的版本 3.4.14。官方下载地址:https://archive.apache.org 阅读全文
posted @ 2020-06-24 16:58 数据驱动 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 一、Sqoop 基本命令 1. 查看所有命令 # sqoop help 2. 查看某条命令的具体使用方法 # sqoop help 命令名 二、Sqoop 与 MySQL 1. 查询MySQL所有数据库 通常用于 Sqoop 与 MySQL 连通测试: sqoop list-databases \ 阅读全文
posted @ 2020-06-24 12:19 数据驱动 阅读(1087) 评论(0) 推荐(0) 编辑
摘要: 一、Sqoop 简介 Sqoop 是一个常用的数据迁移工具,主要用于在不同存储系统之间实现数据的导入与导出: 导入数据:从 MySQL,Oracle 等关系型数据库中导入数据到 HDFS、Hive、HBase 等分布式文件存储系统中; 导出数据:从 分布式文件系统中导出数据到关系数据库中。 其原理是 阅读全文
posted @ 2020-06-24 11:22 数据驱动 阅读(313) 评论(0) 推荐(0) 编辑
摘要: 一、背景 先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将 Flume 聚合后的数据输入到 Storm 等分布式计算框架中,可能就会超过集群的处理能力,这时采用 Kafka 就 阅读全文
posted @ 2020-06-24 10:54 数据驱动 阅读(648) 评论(0) 推荐(0) 编辑
摘要: 一、下载并解压到指定目录 崇尚授人以渔的思想,我说给大家怎么下载就行了,就不直接放连接了,大家可以直接输入官网地址 http://flume.apache.org ,一般在官网的上方或者左边都会有Download按钮,这个在左侧,然后点进去下载想要的版本即可。 这个会有点慢,如果嫌弃的化,可以通过相 阅读全文
posted @ 2020-06-24 10:38 数据驱动 阅读(433) 评论(0) 推荐(0) 编辑
摘要: 一、Flume简介 中文版参考文档 Apache Flume 是一个分布式,高可用的数据收集系统。它可以从不同的数据源收集数据,经过聚合后发送到存储系统中,通常用于日志数据的收集。Flume 分为 NG 和 OG (1.0 之前) 两个版本,NG 在 OG 的基础上进行了完全的重构,是目前使用最为广 阅读全文
posted @ 2020-06-24 10:33 数据驱动 阅读(2714) 评论(0) 推荐(0) 编辑
摘要: 一、前言 使用 Spring+Mybatis 操作 Phoenix 和操作其他的关系型数据库(如 Mysql,Oracle)在配置上是基本相同的,下面会分别给出 Spring/Spring Boot 整合步骤,完整代码见本仓库: Spring + Mybatis + Phoenix SpringBo 阅读全文
posted @ 2020-06-23 18:31 数据驱动 阅读(1078) 评论(0) 推荐(0) 编辑
摘要: 一、Phoenix简介 Phoenix 是 HBase 的开源 SQL 中间层,它允许你使用标准 JDBC 的方式来操作 HBase 上的数据。在 Phoenix 之前,如果你要访问 HBase,只能调用它的 Java API,但相比于使用一行 SQL 就能实现数据查询,HBase 的 API 还是 阅读全文
posted @ 2020-06-23 07:54 数据驱动 阅读(339) 评论(0) 推荐(0) 编辑
摘要: 一、前言 本文主要介绍 Hbase 常用的三种简单的容灾备份方案,即CopyTable、Export/Import、Snapshot。分别介绍如下: 二、CopyTable 2.1 简介 CopyTable可以将现有表的数据复制到新表中,具有以下特点: 支持时间区间 、row 区间 、改变表名称 、 阅读全文
posted @ 2020-06-22 23:34 数据驱动 阅读(774) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 14 下一页