上一页 1 2 3 4 5 6 7 8 9 ··· 12 下一页
摘要: 1.前言 垃圾收集器是前一章垃圾收集算法理论知识的具体实现了,不同虚拟机所提供的垃圾收集器可能会有很大差别,另外我们必须提前说明一个道理:没有最好的垃圾收集器,更加没有万能的收集器,只能选择对具体应用最合适的收集器。这也是HotSpot为什么要实现这么多收集器的原因,下面我们以HotSpot为例讲解 阅读全文
posted @ 2019-05-05 22:05 Runner_Jack 阅读(689) 评论(0) 推荐(0)
摘要: 一、安装Hadoop Hive运行在Hadoop环境之上,因此需要hadoop环境,本次在安装在hadoop完全分布式模式的namennode节点上 请参考:hadoop搭建 二、安装Hive 下载 [hadoop@hadoop01 /home/hadoop]$cd /app/ [hadoop@ha 阅读全文
posted @ 2019-04-11 22:51 Runner_Jack 阅读(1120) 评论(0) 推荐(0)
摘要: 一、前言。 学习大数据组件,最好的方式是直接参照官网。不过官网的教程也让我吃了一坑,在此记录一下。因在个人笔记本资源有限,在此安装为单机版安装 官网参考地址:https://docs.cloudera.com/documentation/enterprise/6/6.0/topics/install 阅读全文
posted @ 2019-04-10 23:22 Runner_Jack 阅读(7146) 评论(0) 推荐(0)
摘要: 1.创建一个类继承UserDefinedAggregateFunction类。 阅读全文
posted @ 2019-04-06 17:34 Runner_Jack 阅读(1195) 评论(0) 推荐(0)
摘要: package cn.piesat.testimport org.apache.spark.sql.SparkSessionimport scala.collection.mutable.ArrayBufferobject SparkSQLTest { def main(args: Array[St 阅读全文
posted @ 2019-04-06 15:19 Runner_Jack 阅读(4907) 评论(0) 推荐(0)
摘要: 一.pom文件 阅读全文
posted @ 2019-04-03 16:07 Runner_Jack 阅读(4382) 评论(0) 推荐(0)
摘要: Eclipse Memory Analyzer Tool(MAT)是一个强大的基于Eclipse的内存分析工具,可以帮助我们找到内存泄露,减少内存消耗。 工作中经常会遇到一些内存溢出、内存泄露等问题,同时还可能导致CPU使用率也很高,因为在频繁的进行GC垃圾回收,这时候就需要分析导致问题的原因,MA 阅读全文
posted @ 2019-03-17 22:24 Runner_Jack 阅读(1271) 评论(0) 推荐(0)
摘要: Java启动参数共分为三类; 其一是标准参数(-),所有的JVM实现都必须实现这些参数的功能,而且向后兼容; 其二是非标准参数(-X),默认jvm实现这些参数的功能,但是并不保证所有jvm实现都满足,且不保证向后兼容; 其三是非Stable参数(-XX),此类参数各个jvm实现会有所不同,将来可能会 阅读全文
posted @ 2019-03-17 18:42 Runner_Jack 阅读(3386) 评论(0) 推荐(0)
摘要: JDK本身提供了很多方便的JVM性能调优监控工具,除了集成式的VisualVM和jConsole外,还有jps、jstack、jmap、jhat、jstat等小巧的工具,本博客希望能起抛砖引玉之用,让大家能开始对JVM性能调优的常用工具有所了解。 现实企业级Java开发中,有时候我们会碰到下面这些问 阅读全文
posted @ 2019-03-16 16:06 Runner_Jack 阅读(1227) 评论(0) 推荐(0)
摘要: 一、方式介绍 本次测试一种采用了四种方式进行了对比,分别是:1.在RDD内部调用java API。2、调用saveAsNewAPIHadoopDataset()接口。3、saveAsHadoopDataset()。4、BulkLoad方法。 测试使用的大数据版本如下(均为单机版):Hadoop2.7 阅读全文
posted @ 2019-03-05 23:06 Runner_Jack 阅读(5413) 评论(4) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 12 下一页