2017 年 7月 27 日随笔档案 - 大数据和AI躺过的坑

2017年7月27日

Storm编程入门API系列之Storm的Topology多个tasks数目控制实现

摘要：前期博客 Storm编程入门API系列之Storm的Topology默认Workers、默认executors和默认tasks数目 Storm编程入门API系列之Storm的Topology多个Workers数目控制实现继续编写 StormTopologyMoreTask.java 打jar包提阅读全文

posted @ 2017-07-27 23:17 大数据和AI躺过的坑阅读(265) 评论(0) 推荐(0) 编辑

Storm编程入门API系列之Storm的Topology多个Executors数目控制实现

摘要：前期博客 Storm编程入门API系列之Storm的Topology默认Workers、默认executors和默认tasks数目 Storm编程入门API系列之Storm的Topology多个Workers数目控制实现继续编写 StormTopologyMoreExecutor.java 打ja 阅读全文

posted @ 2017-07-27 23:02 大数据和AI躺过的坑阅读(390) 评论(0) 推荐(0) 编辑

Storm编程入门API系列之Storm的Topology多个Workers数目控制实现

摘要：前期博客 Storm编程入门API系列之Storm的Topology默认Workers、默认executors和默认tasks数目继续编写 StormTopologyMoreWorker.java 打jar包提交作业之前提交之后为什么，会是如上的数字呢？大家要学，就要深入去学和理解。因为，阅读全文

posted @ 2017-07-27 22:56 大数据和AI躺过的坑阅读(623) 评论(0) 推荐(0) 编辑

Storm编程入门API系列之Storm的Topology默认Workers、默认executors和默认tasks数目

摘要：关于，storm的启动我这里不多说了。见博客 storm的3节点集群详细启动步骤（非HA和HA）（图文详解）建立stormDemo项目 Group Id ： zhouls.bigdata Artifact Id ： stormDemo Package : stormDemo 编写代码StormT 阅读全文

posted @ 2017-07-27 22:35 大数据和AI躺过的坑阅读(1167) 评论(0) 推荐(1) 编辑

kafka启动时出现FATAL Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer) java.io.IOException: Permission denied错误解决办法（图文详解）

摘要：首先，说明，我kafk的server.properties是 kafka的server.properties配置文件参考示范（图文详解）（多种方式）问题详情然后，我启动时，出现如下问题分析是我在新建要么执行启动命令的用户，要么写日志的文件目录权限写日志的文件目录权限问题，新建快了，忘记c 阅读全文

posted @ 2017-07-27 21:50 大数据和AI躺过的坑阅读(32573) 评论(0) 推荐(0) 编辑

storm的3节点集群详细启动步骤（非HA和HA）（图文详解）

摘要：前期博客 apache-storm-1.0.2.tar.gz的集群搭建（3节点）（图文详解）（非HA和HA）启动storm集群（HA）本博文情况是 master（主） nimbus slave1（主）（从） nimbus supervisor slave2（从） supervisor 1、先在m 阅读全文

posted @ 2017-07-27 21:27 大数据和AI躺过的坑阅读(3226) 评论(0) 推荐(0) 编辑

Storm概念学习系列之并行度与如何提高storm的并行度

摘要：不多说，直接上干货！对于storm来说，并行度的概念非常重要！大家一定要好好理解和消化。 storm的并行度，可以简单的理解为多线程。如何提高storm的并行度？ storm程序主要由spout和bolt组成的。spout和bolt在运行期间会生成task实例(new Spout或者new bo 阅读全文

posted @ 2017-07-27 21:13 大数据和AI躺过的坑阅读(650) 评论(0) 推荐(0) 编辑

Storm概念学习系列之storm流程图

摘要：把stream当做一列火车， tuple当做车厢，spout当做始发站，bolt当做是中间站点！！！见 Storm概念学习系列之Spout数据源 Storm概念学习系列之Topology拓扑 Storm概念学习系列之Blot消息处理者 Storm概念学习系列之Tuple元组阅读全文

posted @ 2017-07-27 20:54 大数据和AI躺过的坑阅读(642) 评论(0) 推荐(0) 编辑

kafka的topic命名技巧

摘要：不多说，直接上干货！比如，我们给kafka的topic命名为user_r2p10 表示user这个topic的副本因子（r）是2，分区数（p）是10。这样后期在写消费者代码的时候，根据topic名称就知道分区有多少个，可以很方便的设置多少个消费者线程。比如，如下前期博客，见 Kafka的3节阅读全文

posted @ 2017-07-27 19:35 大数据和AI躺过的坑阅读(13030) 评论(0) 推荐(0) 编辑

kafka的server.properties配置文件参考示范（图文详解）（多种方式）

摘要：简单点的，就是 kafka_2.11-0.8.2.2.tgz的3节点集群的下载、安装和配置（图文详解）但是呢，大家在实际工作中，会一定要去牵扯到调参数和调优问题的。以下，是我给大家分享的kafka的server.properties配置文件参考示范。 master节点上 slave1上 slave 阅读全文

posted @ 2017-07-27 18:07 大数据和AI躺过的坑阅读(16254) 评论(0) 推荐(0) 编辑

kafka_2.11-0.8.2.2.tgz的3节点集群的下载、安装和配置（图文详解）

摘要： kafka_2.10-0.8.1.1.tgz的1或3节点集群的下载、安装和配置（图文详细教程）绝对干货一、安装前准备 1.1 示例机器二、 JDK7 安装 1.1 下载地址下载地址： http://www.oracle.com/technetwork/java/javase/downloads 阅读全文

posted @ 2017-07-27 17:43 大数据和AI躺过的坑阅读(1197) 评论(0) 推荐(0) 编辑

Flume中的flume-env.sh和log4j.properties配置调整建议（图文详解）

摘要： GC是内存的回收的意思。 Flume中的flume-env.sh配置调整建议因为，我一般是喜欢用软连接，所以，这里的路径也是软连接jdk 所以 Flume中的log4j.properties配置调整建议关于 log4j.properties的配置调整，可以进一步看 Flume自定义拦截器（Int 阅读全文

posted @ 2017-07-27 17:12 大数据和AI躺过的坑阅读(3700) 评论(0) 推荐(0) 编辑

Flume自定义拦截器（Interceptors）或自带拦截器时的一些经验技巧总结（图文详解）

摘要：不多说，直接上干货！一、自定义拦截器类型必须是：类全名$内部类名，其实就是内部类名称如：zhouls.bigdata.MySearchAndReplaceInterceptor$Builder 二、为什么这样写至于为什么这样写：是因为Interceptor接口还有一个公共的内部接口（Buil 阅读全文

posted @ 2017-07-27 12:23 大数据和AI躺过的坑阅读(12536) 评论(0) 推荐(4) 编辑

大数据和人工智能躺过的坑

公告