摘要: 1 数据仓库概述 1.1 数据仓库概念 ● 数据仓库:一个为数据分析而设计的企业级数据管理系统。 ● 可集中、整合多个信息源的大量数据。 1.2 数据仓库核心架构 2 数据仓库建模概述 2.1 数据仓库建模的意义 ● 生活引入:如果把数据看作图书馆的数,我们希望看到他们在书架上分门别类地放置。 ● 阅读全文
posted @ 2022-05-13 10:09 白森 阅读(1209) 评论(0) 推荐(0)
摘要: 1 Stream流的概述 1.1 Stream流的目的 目的:用于简化集合和数组操作的API。 ▶【案例】体现Stream流的作用 ● 需求:按照下面的要求完成集合的创建和遍历 ①创建一个集合,存储多个字符串元素 ②把集合中所有以"张"开头的元素存储到一个新的集合 ③把"张"开头的集合中的长度为3的 阅读全文
posted @ 2022-04-27 20:46 白森 阅读(73) 评论(0) 推荐(0)
摘要: 1 问题引出:不同编码读取乱码问题 1. 之前我们使用字符流读取中文是否有乱码? ● 没有的,因为代码编码和文件编码都是UTF-8。 2. 如果代码编码和文件编码不一致,使用字符流直接读取还能不乱码吗? ● 会乱码 ● 文件编码和读取的编码必须一致才不会乱码。 步骤:使用相同编码读取不同编码的文件内 阅读全文
posted @ 2022-01-09 17:16 白森 阅读(57) 评论(0) 推荐(0)
摘要: 1 Redis介绍 1.1 Redis是什么? ● Redis(Remote Dictionary Server),即远程字典服务。key—value存储系统,是跨平台的非关系型数据库。 ● Redis是一个开源的使用ANSI C语言编写、遵循BSD协议、支持网络、可基于内存、分布式、可选持久性的键 阅读全文
posted @ 2022-01-07 18:41 白森 阅读(51) 评论(0) 推荐(0)
摘要: 1 Flume概述 1.1 定义 ● Flume是Cloudera提供的一个高可用,高可靠,分布式的海量日志采集、聚合、传输的框架。 ● 主要作用:实时读取服务器本地磁盘的数据,将数据写入到HDFS。 数据(服务器)——> HDFS 1.2 基础架构 Flume基础构架图: (1) Agent ● 阅读全文
posted @ 2022-01-06 16:14 白森 阅读(97) 评论(0) 推荐(0)
摘要: 1 对象序列化 对象序列化: ● 使用到的流是对象字节输出流:ObjectOutputStreamd ● 作用:以内存为基准,把内存中的对象存储到磁盘文件中去,称为对象序列化 IO体系结构图 对象字节输出流:ObjectOutputStream 构造器 说明 public ObjectOutputS 阅读全文
posted @ 2022-01-03 14:19 白森 阅读(55) 评论(0) 推荐(0)
摘要: Map集合体系 Properties属性集对象 ● 其实就是一个Map集合,但是我们一般不会当集合使用,因为HashMap更好用。 Properties核心作用 ● Properties代表的是一个属性文件,可以把自己对象中的键值对信息存入到一个属性文件中去。 ● 属性文件,后缀是 .propert 阅读全文
posted @ 2022-01-03 14:18 白森 阅读(55) 评论(0) 推荐(0)
摘要: 1 PrintStream、PrintWriter IO体系结构图 打印流 ● 作用:打印流可以实现方便、高效的打印数据到文件中去。打印流一般是指:PrintStream、PrintWriter两个类 ● 可以实现打印什么数据就是什么数据,例如:打印整数97写出去的就是97,打印boolean的tr 阅读全文
posted @ 2022-01-03 14:18 白森 阅读(71) 评论(0) 推荐(0)
摘要: 1 Kafka概述 1.1 定义 ● 基于发布/订阅模式的消息队列(Message Queue)—— 传统 ● 分布式事件流平台(event streaming platform)—— 最新定位 1.2 消息队列 1.2.1 传统消息队列的应用场景 1)引用场景 2)使用消息队列的好处 解耦 ● 允 阅读全文
posted @ 2021-12-31 14:26 白森 阅读(56) 评论(0) 推荐(0)
摘要: 1 大数据概念 1.1 大数据概念 大数据(Big Data) ● 指无法在一定时间范围内用常规工具捕捉、管理、处理的数据集合。 ● 需要新处理模式才能具有鞥讫那个的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 主要解决 ● 海量数据的存储、分析计算问题。 1.2 大数据特点 阅读全文
posted @ 2021-12-31 14:26 白森 阅读(157) 评论(0) 推荐(1)