gyhuminyan

2020年10月20日

摘要：如果防火墙等一切原因都考虑完了还不行，看看网关是否配正确。阅读全文

posted @ 2020-10-20 10:32 gyhuminyan 阅读(95) 评论(0) 推荐(0) 编辑

2018年9月6日

摘要：新的chrome ui真的是不能接受（巨丑），以前不喜欢火狐就是这个原因。废话少说，解决方法： 1.浏览器输入 chrome://flags/#top-chrome-md 2.将default改为normal 3.重启这下，舒服多了阅读全文

posted @ 2018-09-06 10:42 gyhuminyan 阅读(630) 评论(0) 推荐(0) 编辑

2018年8月3日

单例类

摘要：如果一个类始终只能创建一个实例，使用单例类模式阅读全文

posted @ 2018-08-03 11:57 gyhuminyan 阅读(149) 评论(0) 推荐(0) 编辑

2018年7月26日

转：Python- 解决PIP下载安装速度慢

摘要：让PIP源使用国内镜像，提升下载速度和安装成功率。对于Python开发用户来讲，PIP安装软件包是家常便饭。但国外的源下载速度实在太慢，浪费时间。而且经常出现下载后安装出错问题。所以把PIP安装源替换成国内镜像，可以大幅提升下载速度，还可以提高安装成功率。国内源：新版ubuntu要求使用htt 阅读全文

posted @ 2018-07-26 11:39 gyhuminyan 阅读(242) 评论(0) 推荐(0) 编辑

2018年6月13日

Detected cartesian product for LEFT OUTER join

摘要： spark做表连接的时候出现这个错误， Exception in thread "main" org.apache.spark.sql.AnalysisException: Detected cartesian product for LEFT OUTER join between logical 阅读全文

posted @ 2018-06-13 18:30 gyhuminyan 阅读(6371) 评论(0) 推荐(0) 编辑

2018年5月9日

在Kafka中使用Avro编码消息：Producter篇

摘要：本文将介绍如何在 Kafka 中使用 Avro 来序列化消息，并提供完整的 Producter 代码共大家使用。 Avro Avro 是一个数据序列化的系统，它可以将数据结构或对象转化成便于存储或传输的格式。Avro设计之初就用来支持数据密集型应用，适合于远程或本地大规模数据的存储和交换。因为本文并阅读全文

posted @ 2018-05-09 11:16 gyhuminyan 阅读(4186) 评论(0) 推荐(0) 编辑

如何为Kafka集群选择合适的Topics/Partitions数量

摘要：这是许多kafka使用者经常会问到的一个问题。本文的目的是介绍与本问题相关的一些重要决策因素，并提供一些简单的计算公式。越多的分区可以提供更高的吞吐量首先我们需要明白以下事实：在kafka中，单个patition是kafka并行操作的最小单元。在producer和broker端，向每一个分区写入阅读全文

posted @ 2018-05-09 10:48 gyhuminyan 阅读(1084) 评论(0) 推荐(0) 编辑

Spark Streaming 中管理 Kafka Offsets 的几种方式

摘要： Offset管理概述 Spark Streaming集成了Kafka允许用户从Kafka中读取一个或者多个topic的数据。一个Kafka topic包含多个存储消息的分区（partition）。每个分区中的消息是顺序存储，并且用offset（可以认为是位置）来标记消息。开发者可以在他的Spark 阅读全文

posted @ 2018-05-09 10:37 gyhuminyan 阅读(1082) 评论(0) 推荐(0) 编辑

Kafka 在华泰证券的探索与实践

摘要：引言 Apache Kafka 发源于 LinkedIn，于 2011 年成为 Apache 的孵化项目，随后于 2012 年成为 Apache 的顶级项目之一。按照官方定义，Kafka 是一个分布式流平台，具备流数据的发布及订阅（与消息队列或企业级消息系统类似）能力、容错方式的流数据存储能力以及流阅读全文

posted @ 2018-05-09 10:23 gyhuminyan 阅读(1207) 评论(0) 推荐(0) 编辑

Kafka 客户端是如何找到 leader 分区的

摘要：在正常情况下，Kafka中的每个Topic都会有很多个分区，每个分区又会存在多个副本。在这些副本中，存在一个leader分区，而剩下的分区叫做 follower，所有对分区的读写操作都是对leader分区进行的。所以当我们向Kafka写消息或者从Kafka读取消息的时候，必须先找到对应分区的Lead 阅读全文

posted @ 2018-05-09 09:57 gyhuminyan 阅读(1261) 评论(0) 推荐(0) 编辑

公告