摘要:
MYSQL面试50题练习 1、总共有多少表? 四张表 2、表之间的关系 3、准备建表和插入数据 –1.学生表 Student(s_id,s_name,s_birth,s_sex) –学生编号,学生姓名, 出生年月,学生性别 –2.课程表 Course(c_id,c_name,t_id) – –课程编 阅读全文
摘要:
##1、为什么要对数据仓库分层? 1、用空间换时间,通过大量的预处理来提升应用系统的用户体现(效率),因此数据仓库会存在大量冗余的数据。 2、如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。 3、通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分多个 阅读全文
摘要:
##flume简介 flume是一个分布式、可靠、和高可用的海量日志采集、和传输的系统。支持子啊日志系统 中定制各类数据发送方,用于收集数据;同时,flume提供对数据进行简单处理,并写道各种 数据接收方(比如文本、HDFS、Hbase等)的能力,flume的数据流由事件(Event)贯穿始终。 事 阅读全文
摘要:
#记录以下遇到的这个问题2021.4.29 问题的起因还是在于hadoop安全模式的问题,我的安全模式之前出了问题,丢失了数据, 导致我每次启动hadoop集群,都需要自己手动关闭hadoop的安全模式, 于是在网上搜索,找到说可以先关闭集群,然后格式化namenode, 按照这样的方式做了以后,就 阅读全文