会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
冷幽篁
博客园
首页
新随笔
联系
管理
订阅
[置顶]
【CDH部署】CDH6.2安装配置第二篇:CDH安装的前期配置
摘要: 本篇介绍cdh安装之前需要的一些必要配置,当然这些配置也可以用shell脚本来配置。在安装之前请先配置好yum源,在文中用的统一都是阿里源。在安装的时候,要确保主机的内存是4G以上,要不然会无限重启cm服务 另外2篇传送门: CDH6.2安装配置第一篇:CDH配置本地http服务 CDH6.2安装配
阅读全文
posted @ 2020-02-12 15:51 冷幽篁
阅读(1897)
评论(0)
推荐(0)
2021年6月28日
【流数据处理】MySql/PG/Oracle+Kafka+Flink(CDC捕获) 部署及实时计算
摘要: 主要介绍实时数仓得部署、计算 文章主要分3部分 数据采集 \(\color{red}{[E]}\) 关系型数据库MySql/PG/Oracle+Debezium+Kafka Connector 数据计算 \(\color{red}{[T]}\) Flink 数据存储 \(\color{red}{[L
阅读全文
posted @ 2021-06-28 15:38 冷幽篁
阅读(4113)
评论(1)
推荐(0)
2021年1月21日
【概念】详解MapReduce原理
摘要: MapReduce原理 Map阶段 文件在被读取(调用read())的是用Inputformat方法读入的。在这里读入一行,返回一个key-vlaue(K,V)对,key是行号的偏移量,value的值是这一行的内容。 在上述过程中,在第4步调用map()方法后,将以上内容真正转换成(key,valu
阅读全文
posted @ 2021-01-21 19:04 冷幽篁
阅读(648)
评论(0)
推荐(0)
2020年9月4日
HIVE UDF开发,并在CDH5.14上运行。附案例
摘要: Hive的UDF分为3种 UDF : ONE TO ONE,进来一个出去一个 ,row mapping。是row级别操作,如:upper、substr函数 UDAF: manyTO ONE,进来多个出去一个 ,row mapping。是row级别操作,如sum/min。 UDTF: ONE TO m
阅读全文
posted @ 2020-09-04 16:34 冷幽篁
阅读(716)
评论(0)
推荐(0)
2020年6月5日
CDH5.14集成Spark-sql,并用2种方式运行sql。附案例
摘要: 本篇文章主要讲述如何在CDH中启动Spark Thrift。 本次测试的版本: CDH版本:5.14.2 spark:1.6.0 文中主要用root来部署,但是启动的时候用的spark用户,中间会有一些权限方面的问题。大家可以根据提示自行添加权限。我这边权限不够默认都给了777,方便测试。 文中的s
阅读全文
posted @ 2020-06-05 11:23 冷幽篁
阅读(3397)
评论(0)
推荐(0)
2020年5月12日
【Kafka】Kafka常用命令
摘要: kafka交互式命令使用 查看topic /bin/kafka-topics.sh --list --zookeeper 192.168.58.171:2181,192.168.58.177:2181,192.168.58.178:2181 查看指定topic /bin/kafka-topics.s
阅读全文
posted @ 2020-05-12 10:18 冷幽篁
阅读(360)
评论(0)
推荐(0)
2020年5月11日
Flink1.10编译步骤
该文被密码保护。
阅读全文
posted @ 2020-05-11 19:34 冷幽篁
阅读(1066)
评论(0)
推荐(2)
2020年4月15日
【Kafka】Kafka Web端管理界面Cmak(kafka-manager)安装配置
摘要: Kafka Web端管理界面Cmak安装配置 下载地址:https://github.com/yahoo/CMAK 1. 下载完直接解压到当前目录中: unzip cmak-3.0.0.4.zip 2. 修改配置文件 cd /var/cmak/cmak-3.0.0.4/conf vi applica
阅读全文
posted @ 2020-04-15 15:14 冷幽篁
阅读(9807)
评论(2)
推荐(1)
2020年4月9日
Flink通过SQLClinet/Java代码创建kafka源表,指定Offset消费,并进行实时计算,最后sink到mysql表中
摘要: 需要依赖包,并放到flink/lib目录中: 下载地址: https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#jdbc-connector flink-json-1.10.0-sql-
阅读全文
posted @ 2020-04-09 18:53 冷幽篁
阅读(3253)
评论(0)
推荐(0)
2020年4月8日
ORACLE的DDL日志 推送到Kafka,并用Flink进行实时计算
摘要: ORACLE的DDL日志 推送到Kafka,并用Flink进行实时统计 本次测试的环境: 环境:docker oracle12c 日志模式:归档日志模式 archivelog 用户:scott/tiger 具有dba权限 大数据组件:kafka(默认创建好topic:flink_topic),zoo
阅读全文
posted @ 2020-04-08 15:52 冷幽篁
阅读(3273)
评论(2)
推荐(0)
2020年3月19日
Flink读取Kafka数据,进行汇总
摘要: 今天介绍用 Flink 读取Kafka生成的数据,并进行汇总的案例 第一步:环境准备,kafka,flink,zookeeper。我这边是用的CDH环境,kafka跟zookeeper 都安装完毕,并测试可以正常使用 第二步:用kafka创建一个生产者进行消息生产 ./kafka-console-p
阅读全文
posted @ 2020-03-19 14:02 冷幽篁
阅读(8344)
评论(0)
推荐(1)
下一页
公告