2024年4月2日
摘要: 搬家咯,搬家咯 阅读全文
posted @ 2024-04-02 17:49 Flink菜鸟 阅读(7) 评论(0) 推荐(0) 编辑
  2024年3月8日
摘要: Flink 版本:1.17.1 CDC 版本:2.3.0 StarRocks 版本:2.5.8 前言 最近需要实时同步几个 Mysql 表到 StarRocks,薅出之前写的 Demo 代码,简单改造了一下,加了个配置文件,可以通过修改配置文件指定 source、sink 表,这样就不用讲表名什么的 阅读全文
posted @ 2024-03-08 10:37 Flink菜鸟 阅读(68) 评论(0) 推荐(0) 编辑
  2023年5月6日
摘要: 这段时间开始调研使用 StarRocks 做准实时数据仓库:flink cdc 实时同步数据到 StarRocks,然后在 StarRocks 中做分层计算,直接把 StarRocks 中的 ADS 层提供给 BI 查询。架构如下: 由于用到的表比较多,不能用 Flink SQL 给每个表都做个 C 阅读全文
posted @ 2023-05-06 16:36 Flink菜鸟 阅读(3703) 评论(3) 推荐(1) 编辑
摘要: Catalog 类型 以下内容来自官网: Hive Catalog 支持Flink 元数据的持久化存储,以前一直用 Hive Catalog 存,偶尔需要用的时候把 Hive Catalog 开启(需启动 hive metastore 和 hiveserver2,还要启动 Hadoop),大部分时候 阅读全文
posted @ 2023-05-06 16:35 Flink菜鸟 阅读(1949) 评论(0) 推荐(0) 编辑
  2023年3月9日
摘要: 接上篇 Flink SQL 计算 TPS 回顾问题: Flink SQL 每小时计算最近 1 小时内每 10 秒的最近 1 分钟 TPS 显然,Flink 是不支持这种三重时间窗口的,SQL 不行,Stream 也不行,但是 Flink Stream Api 可以调用跟底层的 process 方法自 阅读全文
posted @ 2023-03-09 09:08 Flink菜鸟 阅读(251) 评论(0) 推荐(0) 编辑
  2023年2月20日
摘要: 本文根据 StarRocks 官网 TPC-H 基准测试 操作 准备 硬件 | 项目 | 内容 | |--|--| | 机器 | 3 台华为云服务器 | | CPU | 16 core | | 内存 | 64GB | | 网络 | 1Gbits/s | | 磁盘 | 高效云盘 200GB | 软件 阅读全文
posted @ 2023-02-20 15:55 Flink菜鸟 阅读(539) 评论(0) 推荐(0) 编辑
  2023年2月13日
摘要: 最近听到个奇葩需求: Flink SQL 每小时计算最近 1 小时内每 10 秒的最近 1 分钟 TPS 这个需求有点绕,举个栗子: 比如 11 点计算: 10:01:10 计算区间: 09:59:10 to 10:01:10 (不包含) 10:01:20 计算区间: 09:59:20 to 10: 阅读全文
posted @ 2023-02-13 16:26 Flink菜鸟 阅读(585) 评论(0) 推荐(0) 编辑
  2023年2月2日
摘要: flink 版本: 1.6.0 hive 版本: 3.1.2 sqlSubmit commit commit 0de42fabc1a639c3256ad7d074af72f8f2453be5 修改了sql 文件中的 set 命令(set table.sql-dialect=hive;)执行位置, 从 阅读全文
posted @ 2023-02-02 17:15 Flink菜鸟 阅读(902) 评论(0) 推荐(0) 编辑
  2022年10月21日
摘要: flink udaf demo 之前一个小伙伴留言说想看 TableAggregateFunction 的例子吗?以及自定义函数如何使用sql的方式调用? Flink SQL 我都是用开发的 sqlSubmit 工具做的提交,很多时候会忽略 flink sql client 方式,所以这里写了个简单 阅读全文
posted @ 2022-10-21 10:40 Flink菜鸟 阅读(728) 评论(0) 推荐(0) 编辑
  2022年9月26日
摘要: 有一些数据需要实时的往 StarRocks 写,最开始想得很简单,直接用 insert into values 写入,后来遇到版本号超过 1000 问题。查官网才知道,每个 insert 都会生成一个版本,短时间往后台insert 大量数据是不可行的,才开始用 Stream Load 方式 java 阅读全文
posted @ 2022-09-26 14:11 Flink菜鸟 阅读(3440) 评论(0) 推荐(1) 编辑