2020 年 3月随笔档案 - 碧海潮心

设计模式之建造者模式

摘要：前言建造者模式也是常用的设计模式，Lombok的@Builder就是一个典型的应用。 google guava cache创建cache就只能通过builder方式建造者模式建造者模式有四个角色: 1product 2抽象builder 3实现builder 4 director 建造者模式是阅读全文

posted @ 2020-03-19 12:50 碧海潮心阅读(189) 评论(0) 推荐(0)

google guava cache笔记

摘要：前言最近看代码看到了缓存，缓存有各种各样的实现，基于自定义map，基于工具的。 Guava cache是google开源的，api学习很简单。我直接贴下常用的api代码代码阅读全文

posted @ 2020-03-18 20:45 碧海潮心阅读(221) 评论(0) 推荐(0)

spark保存读取csv SequenceFile

摘要：前言 Spark读取和保存文件格式是非常多的，json，csv,haoop SequenceFile ,hbase等等。本文就是简单的spark读取文件 spark 读写csv 使用opencsv jar包读取，先在maven配置。读取方式因逐行读取、以单个文件为key读取整个文件，代码实现略有不阅读全文

posted @ 2020-03-11 10:24 碧海潮心阅读(1071) 评论(0) 推荐(0)

virtualbox设置两张桥接网卡

摘要：前言我自己家里用无线网络，设置了桥接网卡，到部门就访问不了虚机了。因此需要设置一张新的桥接网卡，电脑在公司连接的是有线，设置桥接网卡犯了一个错误，两种网卡都是无线网络，导致无法连接。 virtualbox设置两种桥接网络查看当前的的本地网络设置网卡一设置网卡二设置虚拟机设置ip 到虚拟机阅读全文

posted @ 2020-03-09 15:52 碧海潮心阅读(481) 评论(0) 推荐(0)

ubuntu配置dns

摘要：前言自己经常使用redhat 或者 centos，但是工作还是接触到ubuntu。因此就准备装一个虚拟机跑docker容器，遇到麻烦的问题就ip地址固化，并设置dns。 dns最后使用netplan工具设置的，dns设置不好识别不了各种域名，下载软件不得行。下载的版本是ubuntu server 阅读全文

posted @ 2020-03-09 14:52 碧海潮心阅读(1249) 评论(0) 推荐(0)

Spark RDD 分区之HashPartitioner

摘要：Spark RDD 分区 Spark RDD分区是并行计算的一个计算单元，RDD在逻辑上被分为多个分区，分区的格式决定了并行计算的粒度，任务的个数是是由最后一个RDD的的分区数决定的。 Spark自带两中分区：HashPartitioner RangerPartitioner。一般而言初始数据是没阅读全文

posted @ 2020-03-04 10:08 碧海潮心阅读(2721) 评论(0) 推荐(0)

Spark键值对操作

摘要：spark pair转化操作 sparik pair rdd是一种键值对数据，常见的转化函数如下图以单词统计使用mapToPair方法，返回二元组使用reduceKey方法归纳统计相同的健，把值相加，统计调用默认的rdd sortByKey函数将所有的字符排序例子源码结果输出阅读全文

posted @ 2020-03-03 11:07 碧海潮心阅读(239) 评论(0) 推荐(0)

spark map flatmap collect方法

摘要：spark rdd的转化方法 rdd作为抽象分布式数据集，有常见的转化函数，比如map，flatmap,collect map和flatMap方法区别 flatmap返回的是扁平化的数值，返回的更多。 map返回的T数目跟原来是一样的，对原来的数据做了处理仍然封装了在一起 collect返回 col 阅读全文

posted @ 2020-03-03 10:36 碧海潮心阅读(701) 评论(0) 推荐(0)

windows配置hadoop并运行程序

摘要：下载程序包并配置 1.http://archive.apache.org/dist/hadoop/core/hadoop 3.0.0/ 2.解压 3.新建系统变量HADOOP_HOME Path增加%HADOOP_HOME%\bin 5.下载 "winUtils" 对应版本的bin，加压并覆盖HAD 阅读全文

posted @ 2020-03-01 22:39 碧海潮心阅读(764) 评论(0) 推荐(0)

idea的Terminal配置PoweShell

摘要：前言本来想参考这篇博文 "IDEA的terminal设置成Linux的终端一样" ,最终配置成功了。win10装成了ubuntu，但是进去之后发现提示装jdk之类，我一想算了，这么烦，我还是配置成PowerShell吧，反正我也懂点shell和bat。 idea terminal配置PowerS 阅读全文

posted @ 2020-03-01 19:58 碧海潮心阅读(2032) 评论(0) 推荐(0)

逆水行舟，不进则退

03 2020 档案

公告