• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
Bazinga32
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

2018年7月23日

Spark体系的各个部分的名字
摘要: SparkContext 是用户通往 Spark 集群的唯一入口,可以用来在 Spark 集群中创建 RDD、累加器 Accumulator 和广播变量 Braodcast Variable 整个应用的上下文,控制应用程序的生命周期,负责调度各个运算资源, 协调各个 Worker 上的 Execut 阅读全文
posted @ 2018-07-23 16:57 Bazinga32 阅读(723) 评论(0) 推荐(0)
 
 

2018年7月20日

Spark 学习笔记
摘要: Spark官网:http://spark.apache.org/ Spark 是一种快速、通用、可扩展的大数据分析引擎 2009 年诞生于加州大学伯克利分校 AMPLab 2010 年开源 2013 年 6 月成为 Apache 孵化项目 2014 年 2 月成为 Apache 顶级项目 Spark 阅读全文
posted @ 2018-07-20 21:00 Bazinga32 阅读(263) 评论(0) 推荐(0)
 
 

2018年7月19日

hadoop生态系统基本介绍
摘要: 1)hadoop 生态系统 hdfs:(Hadoop Distributed File System 分布式文件系统) a) block: hdfs将一个大文件切割成多个小文件,在2.0版本中每个小文件的大小为128MB,这些小文件被称作为块(block) b) namenode:namenode 阅读全文
posted @ 2018-07-19 20:24 Bazinga32 阅读(3465) 评论(0) 推荐(0)
 
yarn的介绍
摘要: 首先我们先了解一下hadoop1.0版本和hadoop2.0版本的区别。 在hadoop1.0中只有两个模块 hdfs 和 mapReduce hdfs负责存储 mapReduce 负责计算 在hadoop1.0中 所有计算相关的 全部放到了mapReduce上 mapReduce在运行的时候有两个 阅读全文
posted @ 2018-07-19 00:05 Bazinga32 阅读(744) 评论(0) 推荐(0)
 
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3