会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
来自遥远的水星
博客园
首页
新随笔
管理
上一页
1
2
3
4
5
6
···
11
下一页
2021年6月30日
Spark(二十一)【SparkSQL读取Kudu,写入Kafka】
摘要: SparkSQL读取Kudu,写出到Kafka 背景:通过spark SQL读kudu表,写入到kafka 参考:1.spark向kafka写入数据 2.通过Spark向Kafka写入数据 1. pom.xml 依赖 <dependencies> <dependency> <groupId>mysq
阅读全文
posted @ 2021-06-30 16:14 来自遥远的水星
阅读(905)
评论(0)
推荐(0)
2021年5月25日
Flink(八)【Flink的窗口机制】
摘要: Flink的窗口机制 1.窗口概述 在流处理应用中,数据是连续不断的,因此我们不可能等到所有数据都到了才开始处理。当然我们可以每来一个消息就处理一次,但是有时我们需要做一些聚合类的处理,例如:在过去的1分钟内有多少用户点击了我们的网页。在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,
阅读全文
posted @ 2021-05-25 11:07 来自遥远的水星
阅读(959)
评论(0)
推荐(0)
2021年5月24日
Fllin(七)【Flink CDC实践】
摘要: FlinkCDC 1.简介 CDC是Change Data Capture(变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入、更新以及删除等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。 CDC种类 CDC主要分为基于查询和基于
阅读全文
posted @ 2021-05-24 11:42 来自遥远的水星
阅读(2146)
评论(0)
推荐(0)
2021年4月27日
Java读文件写入kafka
摘要: Java读文件写入kafka 文件格式 840271 103208 0 0.0 insert 84e66588-8875-4411-9cc6-0ac8302408bf 3 2 4 wangxiao 0.0 0 0.0 9927525 1619330049000 normal 1bd221d73805
阅读全文
posted @ 2021-04-27 10:19 来自遥远的水星
阅读(748)
评论(0)
推荐(0)
2021年4月23日
Java实现读取文件
摘要: Java实现读取文件 1、按字节读取文件内容 使用场景 以字节为单位读取文件,常用于读二进制文件,如图片、声音、影像等文件。 2、按字符读取文件内容 使用场景 以字符为单位读取文件,常用于读文本,数字等类型的文件 3、按行读取文件内容 使用场景 以行为单位读取文件,常用于读面向行的格式化文件 4、随
阅读全文
posted @ 2021-04-23 17:47 来自遥远的水星
阅读(467)
评论(0)
推荐(0)
2021年4月15日
Spark(二十)【SparkSQL将CSV导入Kudu】
摘要: SparkSql 将CSV导入kudu pom 依赖 <properties> <spark.version>2.1.0</spark.version> <scala.version>2.11</scala.version> <project.build.sourceEncoding>UTF-8</
阅读全文
posted @ 2021-04-15 11:24 来自遥远的水星
阅读(230)
评论(0)
推荐(0)
2020年12月17日
Flink(六)【ParameterTool类】
摘要: ParameterTool 工具类 object ParameterToolTest { def main(args: Array[String]): Unit = { val params: ParameterTool = ParameterTool.fromArgs(args) val host
阅读全文
posted @ 2020-12-17 11:51 来自遥远的水星
阅读(1268)
评论(0)
推荐(0)
Flink(五) 【消费kafka】
摘要: 0.目的 测试flink消费kafka的几种消费策略 kafkaSource.setStartFromEarliest() //从起始位置 kafkaSource.setStartFromLatest() //从最新位置 kafkaSource.setStartFromTimestamp("起始时间
阅读全文
posted @ 2020-12-17 11:47 来自遥远的水星
阅读(926)
评论(0)
推荐(0)
2020年10月14日
大数据经典博客文章收集
该文被密码保护。
阅读全文
posted @ 2020-10-14 09:24 来自遥远的水星
阅读(0)
评论(0)
推荐(0)
2020年10月13日
SparkStreaming消费Kafka,手动维护Offset到Mysql
摘要: 说明 当前处理只实现手动维护offset到mysql,只能保证数据不丢失,可能会重复 要想实现精准一次性,还需要将数据提交和offset提交维护在一个事务中 官网说明 Your own data store For data stores that support transactions, sav
阅读全文
posted @ 2020-10-13 15:53 来自遥远的水星
阅读(1005)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
11
下一页