会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
吱吱吱 (piperck) XD
Be more cautious.
github.com/piperck
weibo.com/pieprck
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
···
29
下一页
2019年7月24日
【转】Resource Localization in YARN
摘要: 一个Applciation运行在YARN上的流程为,从YARN Client向ResourceManager提交任务,将Applciation所需资源提交到HDFS中,然后ResourceManager启动APPMaster,APPMaster通知各个NodeManager启动container执行
阅读全文
posted @ 2019-07-24 12:09 piperck
阅读(1184)
评论(0)
推荐(0)
2019年7月17日
什么是 Kafka Rebalance 以及关于 Rebalance Kafka-Python 社区客户端应该关注的地方
摘要: 什么是 Rebalance? Rebalance 为什么会发生? Rebalance 的过程 记得之前在一段时间密集面试的时候总会问候选人这些问题。 什么是 Rebalance 重平衡 Rebalance 就是让整个 Consumer Group 下的所有的 Consumer 实例久如何消费订阅主题
阅读全文
posted @ 2019-07-17 16:39 piperck
阅读(4228)
评论(0)
推荐(0)
2019年7月15日
Kafka 消费者到底是什么 以及消费者位移主题到底是什么(Python 客户端 1.01 broker)
摘要: Kafka 中有这样一个概念消费者组,所有我们去订阅 topic 和 topic 交互的一些操作我们都是通过消费者组去交互的。 在 consumer 端设置了消费者的名字之后,该客户端可以对多个 topic 进行订阅。我们也可以通过 group-id 来识别是谁在消费消息,或者在消费哪些组的消息。
阅读全文
posted @ 2019-07-15 15:12 piperck
阅读(878)
评论(0)
推荐(0)
2019年7月11日
处理 MySQL 因为 SLAVE 崩溃导致需要手动跳过 GTID 的问题 | 关于 GTID
摘要: 今天发生了与之前某篇博客相似的问题,有同学在不同步的 binlog 库中使用语句 database.table 命令对表进行 drop 导致 master 丢弃该表但是从库并未能同步到该操作。并且后续又实用 use xxxx 对该表进行增删字段,由于salve 并未建立此表于是 slave 崩溃的情
阅读全文
posted @ 2019-07-11 21:31 piperck
阅读(3134)
评论(0)
推荐(0)
2019年7月10日
CDH 6.0.1 版本 默认配置下 HUE | happybase 无法访问 Hbase 的问题
摘要: 第一个问题 HUE 无法直接连接到 HBase 在默认配置下 CDH 6.0.1 版本下的 HBase2.0 使用了默认配置 也就是是被勾选的状态,但是 HUE 我找了半天发现无法配置 thift.compact 的启用。所以要使用 hue 来使用 HBase 2.0 就需要把这个 HBase 的参
阅读全文
posted @ 2019-07-10 20:56 piperck
阅读(1489)
评论(0)
推荐(0)
2019年7月4日
Kafka 幂等生产者和事务生产者特性(讨论基于 kafka-python | confluent-kafka 客户端)
摘要: Kafka 提供了一个消息交付可靠性保障以及精确处理一次语义的实现。通常来说消息队列都提供多种消息语义保证 最多一次 (at most once): 消息可能会丢失,但绝不会被重复发送。 至少一次 (at least once): 消息不会丢失,但有可能被重复发送。 精确一次 (exactly on
阅读全文
posted @ 2019-07-04 20:48 piperck
阅读(1239)
评论(0)
推荐(0)
2019年7月2日
【转】浅析Linux中的零拷贝技术
摘要: 本文探讨Linux中主要的几种零拷贝技术以及零拷贝技术适用的场景。为了迅速建立起零拷贝的概念,我们拿一个常用的场景进行引入: 引文## 在写一个服务端程序时(Web Server或者文件服务器),文件下载是一个基本功能。这时候服务端的任务是:将服务端主机磁盘中的文件不做修改地从已连接的socket发
阅读全文
posted @ 2019-07-02 19:31 piperck
阅读(446)
评论(0)
推荐(0)
2019年7月1日
我们使用 Kafka 生产者在发消息的时候我们关注什么(Python 客户端 1.01 broker)
摘要: 之前使用 Kafka 的客户端消费者比较多一点,而且也是无脑订阅使用也没有深入了解过具体的参数。总的来说使用不够细节。 这次公司项目活动期间暴露非常多的问题,于是有了这篇文章。 首先我们来拆解一下 Kafka KafkaProducer 类给我们暴露的参数,我会依次介绍一下这些参数的功能以及效果,其
阅读全文
posted @ 2019-07-01 19:13 piperck
阅读(770)
评论(0)
推荐(1)
2019年6月25日
【转】Python 访问 HDFS
摘要: 1.前言 hdfs , Hadoop Distributed File System。Hadoop的分布式文件系统,安全行和扩展性没得说。 访问HDFS的方式有以下几种: 使用python访问HDFS比较容易: python 封装FS Shell, 这种方式本地必须部署了Hadoop 的 FS Sh
阅读全文
posted @ 2019-06-25 11:36 piperck
阅读(4257)
评论(0)
推荐(0)
2019年6月19日
HIVE 乱码以及 HUE SQL 语句兼容性的记录(遇到应该会一直更新)
摘要: 最近在 HUE 里面查询有中文字段相关的东西被报错警告。。。 通过调整 HUE 使用的某些元数据表的表编码来解决这个问题: 在书写在 MySQL 中能使用的语句的时候还遇到一些无法直接在 hive 或者 presto 中运行的兼容性问题。 例如: presto 可以运行的版本 hive 可以运行个的
阅读全文
posted @ 2019-06-19 18:38 piperck
阅读(1131)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
11
···
29
下一页
公告