会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
kris12
Self-discipline gives me freedom.
博客园
首页
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
31
下一页
2020年3月23日
Flink| 状态管理| 状态编程
摘要: 状态后端(State Backends) 每传入一条数据,有状态的算子任务都会读取和更新状态; 由于有效的状态访问对于处理数据的低延迟至关重要,因此每个并行任务都会在本地内存维护其状态,以确保快速的状态访问。 状态的存储、访问以及维护,由一个可插入的组件决定,这个组件就叫做状态后端(State Ba
阅读全文
posted @ 2020-03-23 23:39 kris12
阅读(4407)
评论(0)
推荐(0)
2020年2月7日
Apache Atlas安装和配置
摘要: Atlas概述 Apache Atlas为组织提供开放式元数据管理和治理功能,用以构建其数据资产目录,对这些资产进行分类和管理,并为数据分析师和数据治理团队,提供围绕这些数据资产的协作功能。 Atlas架构原理 Atlas安装及使用 1)Atlas官网地址:https://atlas.apache.
阅读全文
posted @ 2020-02-07 21:19 kris12
阅读(7858)
评论(1)
推荐(1)
2020年1月31日
Flink| Table API| SQL
摘要: Table API与SQL Table API是流处理和批处理通用的关系型API,Table API可以基于流输入或者批输入来运行而不需要进行任何修改。 Table API是SQL语言的超集并专门为Apache Flink设计的,Table API是Scala 和Java语言集成式的API。与常规S
阅读全文
posted @ 2020-01-31 22:27 kris12
阅读(559)
评论(0)
推荐(0)
2020年1月30日
即时查询工具| Druid
摘要: Druid是一个快速的列式分布式的支持实时分析的数据存储系统,在处理PB级别数据、毫秒级查询、数据实时处理方面,比传统的OLAP系统有了显著的性能改进。 Druid数据结构 与Druid架构相辅相成的是其基于DataSource与Segment的数据结构,它们共同成就了Druid的高性能优势。 Dr
阅读全文
posted @ 2020-01-30 10:20 kris12
阅读(1271)
评论(0)
推荐(0)
2020年1月9日
OLAP分析工具之Presto
摘要: Presto Presto是一个开源的分布式SQL查询引擎,数据量支持GB到PB字节,主要用来处理秒级查询的场景。 虽presto可以解析SQL,但它不是一个标准的数据库,不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP); Presto、Impala性能比较 测试结论:Imp
阅读全文
posted @ 2020-01-09 23:36 kris12
阅读(2040)
评论(0)
推荐(0)
2020年1月2日
linux定时运行命令脚本crontab
摘要: 简介 Linux中,周期执行的任务一般由cron这个守护进程来处理 ps -ef | grep cron cron读取一个或多个配置文件,这些配置文件中包含了命令行及其调用时间。 cron的配置文件称为“crontab”,是“cron table”的简写。 1、/var/spool/cron/ 这个
阅读全文
posted @ 2020-01-02 11:16 kris12
阅读(378)
评论(0)
推荐(0)
2019年12月31日
Flink| time| watermark| Windows窗口
摘要: 1. Window概述 一般真实的流都是无界的,怎么处理无界的数据?可以把无限的数据流进行切分,得到有限的数据集进行处理 也就是得到有界流。 streaming流式计算是一种被设计用于处理无限数据集的数据处理引擎,而无限数据集是指一种不断增长的本质上无限的数据集; 而window是把无限数据流为有限
阅读全文
posted @ 2019-12-31 11:12 kris12
阅读(1406)
评论(0)
推荐(0)
2019年12月21日
多个线程运行MR程序时hadoop出现的问题
摘要: 夜间多个任务同时并行,总有几个随机性有任务失败,查看日志: 刷选关键词 Caused by 或者 FAILED cat -n ads_channel.log |grep "Caused by" 7732 Caused by: java.util.concurrent.ExecutionExcepti
阅读全文
posted @ 2019-12-21 11:38 kris12
阅读(1131)
评论(0)
推荐(0)
2019年12月19日
maxwell实时同步mysql中binlog
摘要: 概述 Maxwell是一个能实时读取MySQL二进制日志binlog,并生成 JSON 格式的消息,作为生产者发送给 Kafka,Kinesis、RabbitMQ、Redis、Google Cloud Pub/Sub、文件或其它平台的应用程序。它的常见应用场景有ETL、维护缓存、收集表级别的dml指
阅读全文
posted @ 2019-12-19 19:47 kris12
阅读(4498)
评论(2)
推荐(2)
2019年12月9日
Hive-05 参数调优
摘要: 调优 Hive提供三种可以改变环境变量的方法,分别是: (1)修改${HIVE_HOME}/conf/hive-site.xml配置文件; 所有的默认配置都在${HIVE_HOME}/conf/hive-default.xml文件中,如果需要对默认的配置进行修改,可以创建一个hive-site.xm
阅读全文
posted @ 2019-12-09 18:39 kris12
阅读(893)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
···
31
下一页
公告
levels of contents