会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Robots2
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
5
6
7
8
9
10
11
12
13
···
35
下一页
2024年4月26日
Iceberg 待学习链接
摘要: 1、Iceberg事务特性解读 https://blog.csdn.net/naisongwen/article/details/123343566 2、FLink全链路时延—测量方式 https://www.cnblogs.com/felixzh/p/15392228.html 3、Flink E
阅读全文
posted @ 2024-04-26 14:35 Robots2
阅读(37)
评论(0)
推荐(0)
2024年4月25日
在flink消费一段时间kafka后,kafka-group的offset被重置了是怎么回事?
摘要: 一、背景 腾讯Flink使用 KafkaSource API创建source端,源码中默认开启了checkpoint的时候提交offset 到kafka-broker。读取kafka数据写入到iceberg 目前发现一个问题,就是消费数据的时候,消费一段时间后,kafka-group的 offset
阅读全文
posted @ 2024-04-25 15:05 Robots2
阅读(662)
评论(0)
推荐(0)
Flink CDC全量和增量同步数据如何保证数据的一致性
摘要: Apache Flink 的 Change Data Capture (CDC) 功能主要用于实时捕获数据库中的变更记录,并将其转换为事件流以供下游处理。为了保证全量和增量数据同步时数据的一致性、不丢失和不重复读取,Flink CDC 采用了以下策略: 一、保证一致性与不丢失 1、使用事务 当进行全
阅读全文
posted @ 2024-04-25 10:25 Robots2
阅读(2978)
评论(0)
推荐(0)
消费幂等
摘要: 为了防止消息重复消费导致业务处理异常,消息队列RocketMQ版的消费者在接收到消息后,有必要根据业务上的唯一Key对消息做幂等处理。本文介绍消息幂等的概念、适用场景以及处理方法。 什么是消息幂等 当出现消费者对某条消息重复消费的情况时,重复消费的结果与消费一次的结果是相同的,并且多次消费并未对业务
阅读全文
posted @ 2024-04-25 09:29 Robots2
阅读(78)
评论(0)
推荐(0)
2024年4月22日
Integer超过128要用对象比较,否则出问题
摘要: 一、测试代码 public void testEquals() { int int1 = 12; int int2 = 12; Integer integer1 = new Integer(12); Integer integer2 = new Integer(12); Integer intege
阅读全文
posted @ 2024-04-22 15:06 Robots2
阅读(128)
评论(0)
推荐(0)
使用iceberg-使用Iceberg数据湖需要注意的点
摘要: 一、资料准备 1、mysql地址选择 因为阿里云只读节点binlog保留时间短,需要用读写集群地址。可以登录阿里云控制台查看地址是只读还是读写,不清楚的话可以找dba要读写地址。 二、Iceberg概念 1、Iceberg选择合适的表版本 简述:Iceberg目前有两个表版本(V1和V2),根据数据
阅读全文
posted @ 2024-04-22 12:15 Robots2
阅读(1693)
评论(0)
推荐(0)
Iceberg问题记录-数据湖问题记录跟进
摘要: 一、问题追踪 问题 详细描述 提出问题时间 是否完成 计划完成时间 备注 了解Iceberg数据存储方式 了解元数据存储信息、数据组织方式、查询时处理流程等 20231013 是 20231019 !!!20231124前均为大致的时间 调研报告:调研报告-基于 Iceberg 构建湖仓一体平台调研
阅读全文
posted @ 2024-04-22 10:55 Robots2
阅读(278)
评论(0)
推荐(0)
Iceberg常用命令
摘要: 一、登录spark客户端 spark-sql --master yarn \ --deploy-mode client \ --queue default \ --name wang \ --driver-memory 12G \ --num-executors 10 \ --executor-co
阅读全文
posted @ 2024-04-22 10:48 Robots2
阅读(445)
评论(0)
推荐(0)
同步工具-腾讯EMR表治理工具安装使用
摘要: 一、安装 1、root用户上传文件 cd wangrz -bey luoshu-1.0-bin.tar.gz 2、解压文件到服务目录 重新安装洛书需执行:rm -rf /usr/local/service/luoshu mkdir /usr/local/service/luoshu tar -zxf
阅读全文
posted @ 2024-04-22 10:45 Robots2
阅读(73)
评论(0)
推荐(0)
2024年4月19日
使用iceberg-flink读取iceberg v2表
摘要: 一、背景 mysql数据入湖后,有同事需要实时抽取iceberg v2表,想通过iceberg做分钟级实时数仓。目前flink社区暂不支持读取v2表。腾讯内部支持 目前只能用Oceanus内置connector,支持flink1.13版本。需要读写时都用iceberg-1.1去处理,因为写入是定制i
阅读全文
posted @ 2024-04-19 16:47 Robots2
阅读(578)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
35
下一页
公告