土豆面包

2021年1月21日

摘要： package rdd.builder import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object Spark_01_RDD_Memory { def main(args: Arra 阅读全文

posted @ 2021-01-21 20:04 土豆面包阅读(141) 评论(0) 推荐(0)

2021年1月20日

Serializable序列化操作解惑

摘要：原文链接：https://baijiahao.baidu.com/s?id=1633305649182361563&wfr=spider&for=pc 阅读全文

posted @ 2021-01-20 17:19 土豆面包阅读(31) 评论(0) 推荐(0)

SparkCore分布式计算模拟

摘要：一、基础的架子假设Executor是服务端，Driver是客户端代码： package test import java.io.InputStream import java.net.{ServerSocket, Socket} object Executor { def main(args: 阅读全文

posted @ 2021-01-20 16:57 土豆面包阅读(117) 评论(0) 推荐(0)

2021年1月19日

spark不同环境下计算pi值

摘要： //本地模式 bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --master local[2] \ ./examples/jars/spark-examples_2.12-3.0.1.jar \ 10 //分布式集群 b 阅读全文

posted @ 2021-01-19 17:48 土豆面包阅读(587) 评论(0) 推荐(0)

2021年1月18日

linux下xsync和xcall脚本及使用xcall jps遇到的一些小问题

摘要： xsync： #!/bin/sh # 获取输入参数个数，如果没有参数，直接退出 pcount=$# if((pcount==0)); then echo no args...; exit; fi # 获取文件名称 p1=$1 fname=`basename $p1` echo fname=$fnam 阅读全文

posted @ 2021-01-18 20:27 土豆面包阅读(687) 评论(0) 推荐(0)

spark之RDD

摘要：一.RDD是什么 RDD, 全称为 Resilient Distributed Datasets, 是一个容错的, 并行的数据结构, 可以让用户显式地将数据存储到磁盘和内存中, 并能控制数据的分区. 同时, RDD 还提供了一组丰富的操作来操作这些数据. 在这些操作中, 诸如 map, flatMa 阅读全文

posted @ 2021-01-18 16:07 土豆面包阅读(87) 评论(0) 推荐(0)

Scala 偏函数和偏应用函数

摘要：原文链接：https://blog.csdn.net/qiruiduni/article/details/46914397 阅读全文

posted @ 2021-01-18 14:47 土豆面包阅读(43) 评论(0) 推荐(0)

2021年1月17日

spark本地体验WordCount

摘要：一、流程分析二、代码部分 1 package wc 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.{SparkConf, SparkContext} 5 6 object Spark_WordCount { 7 8 de 阅读全文

posted @ 2021-01-17 16:04 土豆面包阅读(125) 评论(0) 推荐(0)

2020年12月11日

《架构之美》03

摘要： 1. 系统的伸缩性需求。如大型在线游戏，需要满足大量用户。在线用户数量短时间内可能有很大的变化。这其中隐含的需求是：多用户并行分布式系统，系统运行在多台机器上高可扩展性（用于加入新的故事情节，意味着新的代码）高稳定性、可靠性（一个用户崩溃，不影响其他用户）数据一致性（多个用户看到同一个东西的状态应该阅读全文

posted @ 2020-12-11 16:23 土豆面包阅读(57) 评论(0) 推荐(0)

2020年12月5日

《架构之美》阅读笔记02

摘要： 1. 新代码的定位一开始就有系统结构清晰的总体视图，所以，新的功能单元可以添加到正确的功能区域，而不是为了一时方便，代码随意添加。（这样，有的时候开发者的工作会需要动写脑筋，但是在系统维护和扩展时，就变得容易了）2. 系统的一致性顶层设计的良好风格和决定，为底层代理好处，代码是统一、整洁的。清晰的定阅读全文

posted @ 2020-12-05 15:12 土豆面包阅读(57) 评论(0) 推荐(0)

公告