摘要: MYSQL面试50题练习 1、总共有多少表? 四张表 2、表之间的关系 3、准备建表和插入数据 –1.学生表 Student(s_id,s_name,s_birth,s_sex) –学生编号,学生姓名, 出生年月,学生性别 –2.课程表 Course(c_id,c_name,t_id) – –课程编 阅读全文
posted @ 2021-04-26 23:23 男神睛 阅读(208) 评论(0) 推荐(0) 编辑
摘要: ##1、为什么要对数据仓库分层? 1、用空间换时间,通过大量的预处理来提升应用系统的用户体现(效率),因此数据仓库会存在大量冗余的数据。 2、如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。 3、通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分多个 阅读全文
posted @ 2021-05-22 22:48 男神睛 阅读(67) 评论(0) 推荐(0) 编辑
摘要: ##flume简介 flume是一个分布式、可靠、和高可用的海量日志采集、和传输的系统。支持子啊日志系统 中定制各类数据发送方,用于收集数据;同时,flume提供对数据进行简单处理,并写道各种 数据接收方(比如文本、HDFS、Hbase等)的能力,flume的数据流由事件(Event)贯穿始终。 事 阅读全文
posted @ 2021-04-29 21:01 男神睛 阅读(202) 评论(0) 推荐(0) 编辑
摘要: #记录以下遇到的这个问题2021.4.29 问题的起因还是在于hadoop安全模式的问题,我的安全模式之前出了问题,丢失了数据, 导致我每次启动hadoop集群,都需要自己手动关闭hadoop的安全模式, 于是在网上搜索,找到说可以先关闭集群,然后格式化namenode, 按照这样的方式做了以后,就 阅读全文
posted @ 2021-04-29 13:28 男神睛 阅读(857) 评论(0) 推荐(0) 编辑
摘要: SQOOP安装及使用 SQOOP安装 1、上传并解压 tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /usr/local/soft/ 2、修改文件夹名字 mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha/ 阅读全文
posted @ 2021-04-26 13:56 男神睛 阅读(459) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2021-04-26 10:59 男神睛 阅读(0) 评论(0) 推荐(0) 编辑