摘要: 1.描述Spark Context初始化流程 2.描述Spark中作业提交作业运行流程 阅读全文
posted @ 2018-02-01 17:50 光辉蝈蝈 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 1.Trait相当于Java中的接口,但是比Java中的接口功能更强大些, 2.在Trait中可以写未实现的成员,也可以写已经实现的成员(就是带有方法体的方法,) 3.在Trait中可以实现Trait,同时也可以实现Class类 4.在Trait可以记性多实现 阅读全文
posted @ 2018-02-01 14:45 光辉蝈蝈 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 一、类加载时机: 1、类初始化时机 1)遇到new、getstatic、putstatic或invokestatic这四个字节码指令时,如果类没有进行过初始化,则需要先对其进行初始化。 2)使用Java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先出发器初 阅读全文
posted @ 2018-01-23 21:33 光辉蝈蝈 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 一、虚拟机内存模型 1、线程私有的数据区 线程私有的数据区包括程序计数器、虚拟机栈和本地方法栈三个区域, a.程序计数器 当线程数超过CPU数量或CPU内核数量时,线程之间就要根据时间片就要根据时间片轮询抢夺cpu时间资源,因此 为了线程切换后能恢复到正确执行位置,每条线程都需要独立的计数器去记录其 阅读全文
posted @ 2018-01-22 19:33 光辉蝈蝈 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 一、垃圾回收的意义: 在Java中,当没有对象引用指向原先分配给某个对象时,该内存便成为垃圾。实际上,除了释放没用的对象,垃圾回收也可以清除内存记录碎片。垃圾回收能自动的释放内存空间,减轻编程的负担,这Java虚拟机具有一些优点,首先,它能使编程效率提高。在没有回收机制的视乎,可能要花费许多时间来解 阅读全文
posted @ 2018-01-22 17:05 光辉蝈蝈 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 1.storm整体架构(画图+描述) storm的数据流程: storm分布式计算结构称为topology(拓扑),由stream(数据流)、spout(数据流的生成者)、bolt(运算)组成 stream: storm的核心数据结构是tuple(元祖),tuple是包含一个或者多个键值对的列表,S 阅读全文
posted @ 2018-01-19 19:44 光辉蝈蝈 阅读(438) 评论(0) 推荐(0) 编辑
摘要: 1.一个简单的mapreduce代码,单词计数的一个实例代码: 2.学习一个测试实例: 阅读全文
posted @ 2018-01-18 22:06 光辉蝈蝈 阅读(482) 评论(0) 推荐(0) 编辑
摘要: 1.hbase的特点: 1.它介于nosql和RDBMS之间,仅能通过主键(row key) 和主键的range来检索数据,仅支持单行事务, 2.Hbase查询数据功能简单,不支持join等复杂的操作 3.不支持复杂的事务 4.hbase中支持的数据类型:byte[] 5.主要用来存储结构化和半结构 阅读全文
posted @ 2018-01-18 14:53 光辉蝈蝈 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 1.zookeeper应用场景: 配置管理:可以在zookeeper写配置项,使我们的整个集群都可以访问到。 名字d服务:可以和我们的Linux中的hosts文件一样,让我们的名字和ip地址联系起来 组员管理,简单互斥锁,互斥锁,读写锁, 2.zookeeper使用的协议:ZAB协议 3.zooke 阅读全文
posted @ 2018-01-18 12:50 光辉蝈蝈 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 1.简述flume的核心组件: agent:是数据源,agent获取数据的一个组件,然后将数据放到管道里channel,推送到管道中。 channel:就是保证数据的安全性和完整性,起到一个缓冲的作用。 sink:将我们的数据拉取出来,然后在进行放到文件中获取hdfs中 阅读全文
posted @ 2018-01-18 11:47 光辉蝈蝈 阅读(112) 评论(0) 推荐(0) 编辑