2017年9月20日

Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN

摘要: Spark 编程指南 概述 Spark 依赖 初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs) 并行集合 外部 Datasets(数据集) RDD 操作 基础 传递 Functions(函数)给 Spark 理解闭包 示例 Local(本地)vs. cluster(集群)模式 打 阅读全文

posted @ 2017-09-20 14:41 那伊抹微笑 阅读(158) 评论(0) 推荐(0) 编辑

Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

摘要: 快速入门 使用 Spark Shell 进行交互式分析 基础 Dataset 上的更多操作 缓存 独立的应用 快速跳转 基础 Dataset 上的更多操作 缓存 本教程提供了如何使用 Spark 的快速入门介绍。首先通过运行 Spark 交互式的 shell(在 Python 或 Scala 中)来 阅读全文

posted @ 2017-09-20 14:13 那伊抹微笑 阅读(552) 评论(0) 推荐(0) 编辑

Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN

摘要: Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于 阅读全文

posted @ 2017-09-20 13:52 那伊抹微笑 阅读(347) 评论(0) 推荐(1) 编辑

2017年8月28日

Apache Storm 1.1.0 中文文档 | ApacheCN

摘要: 前言 Apache Storm 是一个免费的,开源的,分布式的实时计算系统. 官方文档: 中文文档: "ApacheCN" 最近组织了翻译 "Storm 1.1.0 中文文档" 的活动,整体 "翻译进度" 为 96%. 感谢大家参与到该活动中来 感谢无私奉献的 "贡献者" ,才有了这份 "Storm 阅读全文

posted @ 2017-08-28 14:51 那伊抹微笑 阅读(815) 评论(7) 推荐(7) 编辑

导航