Runner_Jack

2019年5月5日

摘要： 1.前言垃圾收集器是前一章垃圾收集算法理论知识的具体实现了，不同虚拟机所提供的垃圾收集器可能会有很大差别，另外我们必须提前说明一个道理：没有最好的垃圾收集器，更加没有万能的收集器，只能选择对具体应用最合适的收集器。这也是HotSpot为什么要实现这么多收集器的原因，下面我们以HotSpot为例讲解阅读全文

posted @ 2019-05-05 22:05 Runner_Jack 阅读(701) 评论(0) 推荐(0)

2019年4月11日

hive2.3.4安装

摘要：一、安装Hadoop Hive运行在Hadoop环境之上，因此需要hadoop环境，本次在安装在hadoop完全分布式模式的namennode节点上请参考：hadoop搭建二、安装Hive 下载 [hadoop@hadoop01 /home/hadoop]$cd /app/ [hadoop@ha 阅读全文

posted @ 2019-04-11 22:51 Runner_Jack 阅读(1134) 评论(0) 推荐(0)

2019年4月10日

Centos7搭建CDH6.0.1(单机版)

摘要：一、前言。学习大数据组件，最好的方式是直接参照官网。不过官网的教程也让我吃了一坑，在此记录一下。因在个人笔记本资源有限，在此安装为单机版安装官网参考地址：https://docs.cloudera.com/documentation/enterprise/6/6.0/topics/install 阅读全文

posted @ 2019-04-10 23:22 Runner_Jack 阅读(7161) 评论(0) 推荐(0)

2019年4月6日

SparkSQL之UDAF使用

摘要： 1.创建一个类继承UserDefinedAggregateFunction类。阅读全文

posted @ 2019-04-06 17:34 Runner_Jack 阅读(1206) 评论(0) 推荐(0)

SparkSQL之UDF使用

摘要： package cn.piesat.testimport org.apache.spark.sql.SparkSessionimport scala.collection.mutable.ArrayBufferobject SparkSQLTest { def main(args: Array[St 阅读全文

posted @ 2019-04-06 15:19 Runner_Jack 阅读(4924) 评论(0) 推荐(0)

2019年4月3日

spark写数据入kafka示范代码

摘要：一.pom文件阅读全文

posted @ 2019-04-03 16:07 Runner_Jack 阅读(4403) 评论(0) 推荐(0)

2019年3月17日

使用Eclipse Memory Analyzer Tool（MAT）分析故障

摘要： Eclipse Memory Analyzer Tool（MAT）是一个强大的基于Eclipse的内存分析工具，可以帮助我们找到内存泄露，减少内存消耗。工作中经常会遇到一些内存溢出、内存泄露等问题，同时还可能导致CPU使用率也很高，因为在频繁的进行GC垃圾回收，这时候就需要分析导致问题的原因，MA 阅读全文

posted @ 2019-03-17 22:24 Runner_Jack 阅读(1334) 评论(0) 推荐(0)

JVM启动参数大全及默认值

摘要： Java启动参数共分为三类；其一是标准参数（-），所有的JVM实现都必须实现这些参数的功能，而且向后兼容；其二是非标准参数（-X），默认jvm实现这些参数的功能，但是并不保证所有jvm实现都满足，且不保证向后兼容；其三是非Stable参数（-XX），此类参数各个jvm实现会有所不同，将来可能会阅读全文

posted @ 2019-03-17 18:42 Runner_Jack 阅读(3428) 评论(0) 推荐(0)

2019年3月16日

JVM性能调优监控工具jps、jstack、jmap、jhat、jstat、jinfo、jconsole使用详解

摘要： JDK本身提供了很多方便的JVM性能调优监控工具，除了集成式的VisualVM和jConsole外，还有jps、jstack、jmap、jhat、jstat等小巧的工具，本博客希望能起抛砖引玉之用，让大家能开始对JVM性能调优的常用工具有所了解。现实企业级Java开发中，有时候我们会碰到下面这些问阅读全文

posted @ 2019-03-16 16:06 Runner_Jack 阅读(1237) 评论(0) 推荐(0)

2019年3月5日

Spark入Hbase的四种方式效率对比

摘要：一、方式介绍本次测试一种采用了四种方式进行了对比，分别是：1.在RDD内部调用java API。2、调用saveAsNewAPIHadoopDataset（）接口。3、saveAsHadoopDataset（）。4、BulkLoad方法。测试使用的大数据版本如下（均为单机版）：Hadoop2.7 阅读全文

posted @ 2019-03-05 23:06 Runner_Jack 阅读(5425) 评论(4) 推荐(0)

公告