上一页 1 2 3 4 5 6 7 8 9 ··· 32 下一页

2017年5月3日

摘要: 当有一个复杂的工作流job,希望每天定时执行,使用crontab方式调用需要编写大量的脚本,还要通过大量的判断来控制每个工作流job的执行顺序问题。Oozie中的Coordinator可以让每个工作流workflow当做一个动作来运行,这样就可以将多个job组织起来,并制定触发时间和频率。它的调度方 阅读全文
posted @ 2017-05-03 23:01 ilinux_one 阅读(615) 评论(0) 推荐(0) 编辑
摘要: 19.png 19.png 20.png 20.png 21.png 21.png 22.png 22.png 阅读全文
posted @ 2017-05-03 22:41 ilinux_one 阅读(1024) 评论(0) 推荐(0) 编辑
摘要: 1. Hadoop常见调度框架: (1)Linux Crontab:Linux自带的任务调度计划,在任务比较少的情况下,可以使用这种方式,直接执行脚本,例如添加一个执行计划: 0 12 * hive -f xxx.sql(2)Azkaban:(3)Oozie:Cloudera公司开源(4)Zeus: 阅读全文
posted @ 2017-05-03 22:25 ilinux_one 阅读(7753) 评论(0) 推荐(2) 编辑

2017年4月28日

摘要: 只需要确保您的电脑已装好Java环境,那么就可以开始了。 一. 准备工作 1. 下载Hadoop2.7.1版本(写Spark和Hadoop主要是用到了Yarn,因此Hadoop必须安装) 下载地址:http://apache.fayea.com/hadoop/common/hadoop-2.7.1/ 阅读全文
posted @ 2017-04-28 22:44 ilinux_one 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 对于从Kafka、Flume以及Kinesis这类数据源提取数据的流式应用来说,还需要额外增加相应的依赖项,下表列出了各种数据源对应的额外依赖项: 阅读全文
posted @ 2017-04-28 22:04 ilinux_one 阅读(178) 评论(0) 推荐(0) 编辑

2017年4月27日

摘要: Spark SQL有两种方法将RDD转为DataFrame。 1. 使用反射机制,推导包含指定类型对象RDD的schema。这种基于反射机制的方法使代码更简洁,而且如果你事先知道数据schema,推荐使用这种方式; 2. 编程方式构建一个schema,然后应用到指定RDD上。这种方式更啰嗦,但如果你 阅读全文
posted @ 2017-04-27 00:13 ilinux_one 阅读(1121) 评论(0) 推荐(0) 编辑

2017年4月24日

摘要: Spark远程调试 本例子介绍简单介绍spark一种远程调试方法,使用的IDE是IntelliJ IDEA。 1、了解jvm一些参数属性 -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=8888 这里对上面的几个参数进 阅读全文
posted @ 2017-04-24 23:43 ilinux_one 阅读(5467) 评论(0) 推荐(0) 编辑
摘要: Spark集群模式&Spark程序提交 1. 集群管理器 Spark当前支持三种集群管理方式 Standalone—Spark自带的一种集群管理方式,易于构建集群。 Apache Mesos—通用的集群管理,可以在其上运行Hadoop MapReduce和一些服务应用。 Hadoop YARN—Ha 阅读全文
posted @ 2017-04-24 23:36 ilinux_one 阅读(1383) 评论(0) 推荐(0) 编辑
摘要: 执行时需要传入的参数说明 Usage: spark-submit [options] <app jar | Python file> [app options] 参数名称 含义 --master MASTER_URL 可以是spark://host:port, mesos://host:port, 阅读全文
posted @ 2017-04-24 23:22 ilinux_one 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 基于maven配置的scala开发环境,首先需要安装 idea 的scala plugin.然后就可以使用maven编译scala程序了.一般情况下都是java scala的混合,所以src下面有java scala两个源文件目录. 1 <?xml version="1.0" encoding="U 阅读全文
posted @ 2017-04-24 23:11 ilinux_one 阅读(306) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 32 下一页

导航