上一页 1 2 3 4 5 6 7 8 9 ··· 15 下一页
摘要: 2015年7月06:release 2.7.1(稳定)请参阅 Hadoop 2.7.1发布说明 对131个bug修复和列表 从先前版本2.7.0补丁。 请看看 2.7.0章节列表的增强功能启用 第一个2.7.x稳定版本。2015年4月21日:release 2.7.0可用Apache Hadoop ... 阅读全文
posted @ 2015-08-02 19:39 孟尧 阅读(531) 评论(0) 推荐(0)
摘要: 客户端与HDFS文件读取 创建HDFS文件系统实例 FileSystem fs = FileSystem.get(new URI("hdfs://ns1"), new Configuration(),"root"); 客户端通过调用FileSystem对象fs的Open()方法打开要读取的... 阅读全文
posted @ 2015-08-02 19:14 孟尧 阅读(3447) 评论(0) 推荐(0)
摘要: HDFS Federation NameNode在内存中保存文件系统中每个文件和每个数据块的引用关系,这意味着对于一个拥有大量文件的超大集群来说,内存将成为限制系统横向扩展的瓶颈。在2.0发行版本系列中引入的Federation HDFS允许 系统通过添加NameNode实现扩展,其中每个N... 阅读全文
posted @ 2015-08-02 17:47 孟尧 阅读(1502) 评论(0) 推荐(0)
摘要: Hadoop分布式文件系统即Hadoop Distributed FileSystem。 当数据集的大小超过一台独立的物理计算机的存储能力时,就有必要对它进行分区(Partition)并存储到若干台单独的计算机上,管理网络中跨越多台计算机存储的文件系统成为分布式文件系统(Distributed F... 阅读全文
posted @ 2015-08-02 16:03 孟尧 阅读(1248) 评论(0) 推荐(0)
摘要: package com.mengyao.spider.utils;import java.util.ArrayList;import java.util.HashMap;import java.util.Iterator;import java.util.List;import java.util.... 阅读全文
posted @ 2015-08-02 14:41 孟尧 阅读(700) 评论(0) 推荐(0)
摘要: Spark on YARN模式的核心实现有2个类,分别是Client(org.apache.spark.deploy.yarn.Client.scala)和ApplicationMaster(org.apache.spark.deploy.yarn.ApplicationMaster.scala)。 阅读全文
posted @ 2015-08-02 13:01 孟尧 阅读(627) 评论(0) 推荐(0)
摘要: Spark在运行含shuffle过程的应用时,Executor进程除了运行task,还要负责写shuffle数据并未其他Executor提供shuffle数据。当Executor进程任务负载过重而宕掉时就会影响到任务运行。因此,Spark提供了一个叫做ExternalShuffleService的实 阅读全文
posted @ 2015-08-01 20:35 孟尧 阅读(806) 评论(0) 推荐(0)
摘要: 1、在Windows中安装 // 1.1、下载windows版netcat 从https://eternallybored.org/misc/netcat/netcat-win32-1.12.zip下载// 1.2、查看下载的netcat压缩包内容,如下图所示: // 1.3、将nc.exe解压到C 阅读全文
posted @ 2015-07-30 20:32 孟尧 阅读(507) 评论(0) 推荐(0)
摘要: 在使用DSL方式(DataFrame/DataSet)编写时Spark SQL时,会通过SparkSession.read.format(source: String)或SparkSession.write.format(source: String)来指定要读写的数据源,常见的有jdbc、parq 阅读全文
posted @ 2015-07-30 16:54 孟尧 阅读(2533) 评论(0) 推荐(1)
摘要: spark.yarn.archive需要手动将spark应用依赖jar上传到hdfs,该属性可以避免每一次运行spark应用时都重复打zip包上传到hdfs。 官网http://spark.apache.org/docs/latest/running-on-yarn.html#spark-prope 阅读全文
posted @ 2015-07-29 09:45 孟尧 阅读(257) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 15 下一页