BigData - 随笔分类 - MoooJL

TXT格式文件插入Hive

摘要：1 Hive操作 1.1 创建数据库 create database if not exists myhive; use myhive; 1.2 创建表 row format delimited fields terminated by ',':指定字段之间的分隔符stored as textfil 阅读全文

posted @ 2020-11-30 00:15 MoooJL 阅读(609) 评论(0) 推荐(0)

TXT格式文件插入Hbase

摘要：将.txt格式文件插入Hbase中，代码如下 package addHbase; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.ap 阅读全文

posted @ 2020-11-05 23:07 MoooJL 阅读(493) 评论(0) 推荐(0)

HDFS的JAVA操作

摘要：1 HDFS的必会Java操作 1.1 创建目录 //创建目录 public static void mkdir(String filePath) throws URISyntaxException, IOException, InterruptedException{ FileSystem fs 阅读全文

posted @ 2020-10-23 09:22 MoooJL 阅读(192) 评论(0) 推荐(0)

Hbase的常用shell命令+Java操作

摘要：1 Hbase常用shell命令 1.1 进入命令行 hbase shell 1.2 常用命令 help 查看命令的使用描述 help '命令名' whoami 身份(root、user) whoami version 返回hbase版本信息 version status 返回hbase集群的状态信阅读全文

posted @ 2020-10-18 23:06 MoooJL 阅读(367) 评论(0) 推荐(1)

MapReduce案例-流量统计

摘要：一、MapReduce案例-流量统计源数据源代码 1：需求一: 统计求和统计每个手机号的上行数据包总和，下行数据包总和，上行总流量之和，下行总流量之和分析：以手机号码作为key值，上行流量，下行流量，上行总流量，下行总流量四个字段作为value值，然后以这个key，和value作为map阶阅读全文

posted @ 2020-08-29 20:07 MoooJL 阅读(2131) 评论(0) 推荐(0)

大数据学习总结14

摘要：1、MapReduce 排序和序列化序列化 (Serialization) 是指把结构化对象转化为字节流反序列化 (Deserialization) 是序列化的逆过程. 把字节流转为结构化对象. 当要在进程间传递对象或持久化对象的时候, 就需要序列化对象成字节流, 反之当要将接收到或从磁盘读取的阅读全文

posted @ 2020-08-28 19:32 MoooJL 阅读(201) 评论(0) 推荐(0)

大数据学习总结13

摘要：一、Hadoop-Mapreduce 1. MapReduce 介绍 MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。 Map负责“分”，即把复杂的任务分解为若干个“简单的任务”来并行阅读全文

posted @ 2020-08-26 17:48 MoooJL 阅读(226) 评论(0) 推荐(0)

大数据学习总结12

摘要：一、HDFS 的 API 操作导入maven依赖 <dependencies> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>2.7.5</vers 阅读全文

posted @ 2020-08-23 19:12 MoooJL 阅读(167) 评论(0) 推荐(0)

大数据学习总结11

摘要：1、HDFS 文件写入过程 2、HDFS 文件读取过程 3、HDFS 的元数据辅助管理当 Hadoop 的集群当中, NameNode的所有元数据信息都保存在了 FsImage 与 Eidts 文件当中, 这两个文件就记录了所有的数据的元数据信息 edits edits 存放了客户端最近一段时间的阅读全文

posted @ 2020-08-23 15:34 MoooJL 阅读(121) 评论(0) 推荐(0)

大数据学习总结10

摘要：一、hdfs的高级使用命令 hdfs dfs -count -q -h /user/root/dir1 #查看配额信息 1、数量限额 hdfs dfs -mkdir -p /user/root/dir #创建hdfs文件夹 hdfs dfsadmin -setQuota 2 dir # 给该文件夹下阅读全文

posted @ 2020-08-22 22:59 MoooJL 阅读(169) 评论(0) 推荐(0)

大数据学习总结09

摘要：一、hdfs的命令行使用 1、ls 格式：hdfs dfs -ls URI 作用：类似于Linux的ls命令，显示文件列表 2、-ls -R 格式 : hdfs dfs -ls -R URI 作用: 在整个目录下递归执行ls, 与UNIX中的ls-R类似 3、mkdir 格式：hdfs dfs [- 阅读全文

posted @ 2020-08-22 19:29 MoooJL 阅读(155) 评论(0) 推荐(0)

大数据学习总结08

摘要：Hadoop 核心-HDFS 一、HDFS概述在现代的企业环境中，单机容量往往无法存储大量数据，需要跨机器存储。统一管理分布在集群上的文件系统称为分布式文件系统。HDFS（Hadoop Distributed File System）是 Apache Hadoop 项目的一个子项目. Hado 阅读全文

posted @ 2020-08-22 18:26 MoooJL 阅读(136) 评论(0) 推荐(0)

大数据学习总结07

摘要：一、Znode节点属性 dataVersion：数据版本, 每次当 Znode 中的数据发生变化的时候, dataVersion都会自增一下cversion：节点版本, 每次当 Znode 的节点发生变化的时候, cversion 都会自增aclVersion：ACL(Access Control 阅读全文

posted @ 2020-08-21 14:41 MoooJL 阅读(143) 评论(0) 推荐(0)

大数据学习总结06

摘要：一、Zookeeper 1、Zookeeper理解概念：Zookeeper 是一个开源的分布式协调服务框架，主要用来解决分布式集群中应用系统的一致性问题和数据管理问题特点：Zookeeper 本质上是一个分布式文件系统, 适合存放小文件，也可以理解为一个数据库。 Zookeeper 中存储的其阅读全文

posted @ 2020-08-21 14:22 MoooJL 阅读(225) 评论(1) 推荐(0)

大数据学习总结05

摘要：四、shell编程 1、案例案例01：基本语法案例02：局部变量案例03：特殊字符案例04：运算符例05：if语句案例06：for语句案例07：函数阅读全文

posted @ 2020-08-18 13:49 MoooJL 阅读(114) 评论(0) 推荐(0)

大数据学习总结04

摘要：三、BI数据可视化平台—Superset Superset是一款开源的现代化企业级BI。它是目前开源的数据分析和可视化工具中比较好用的，功能简单但可以满足我们对数据的基本需求，支持多种数据源，图表类型多，易维护，易进行二次开发。 1、入门案例：将数据库里的数据按照要求进行可视化展示摘要：通过跟随视阅读全文

posted @ 2020-08-17 23:20 MoooJL 阅读(132) 评论(0) 推荐(0)

大数据学习总结03

摘要：二、可视化ETL平台——Kettle ETL，是英文Extract-Transform-Load的缩写，用来描述将数据从来源端经（extrac过抽取t）、转换（transform）、加载（load）至目的端的过程。ETL是将业务系统的数据经过抽取、清洗、转换之后加载到数据仓库的过程，目的是将分散、零阅读全文

posted @ 2020-08-15 17:51 MoooJL 阅读(163) 评论(0) 推荐(0)

大数据学习总结02

摘要：7、压缩、解压 ①解压：tar -zxvf 压缩文件 [-C] [指定解压目录] tar -zxvf redis-3.2.8.tar.gz #将文件解压到当前目录 tar -zxvf redis-3.2.8.tar.gz -C /root/dir #将文件解压到指定目录 ②压缩：tar -c[z]v 阅读全文

posted @ 2020-08-10 18:47 MoooJL 阅读(125) 评论(0) 推荐(0)

大数据学习总结01

摘要：一、Linux终端命令 1、显示文件列表命令：ls 例： ls #查看当前目录内容 (缺点: 隐藏文件看不到) ls -a #查看当前目录内容 ,包括隐藏文件 ls -al #查看目录内容的详细信息(查看文件类型、权限、大小等) ls -lh #查看目录内容的详细信息,以K,M,G方式显示文件大小阅读全文

posted @ 2020-08-10 16:13 MoooJL 阅读(149) 评论(0) 推荐(0)

MoooJL

业精于勤，荒于嬉；行成于思，毁于随

随笔分类 - BigData

公告