随笔分类 - hadoop
大数据平台
该文被密码保护。
该文被密码保护。
摘要:一些概念 安装 mysql hive 安装步骤 接下来,我们需要去 创建我们的 mysql 数据库服务器 以及数据库实例 并且,需要在 hdfs 文件系统上为 hive 创建 对应的文件目录 如 下图所示 ./hive 进入 交互 show databases; vim testdata.txt 1
阅读全文
摘要:wget tar 包 从 hadoop etc/hadoop/下拷贝 两份配置文件到 hbase conff 下 1、 修改 hbase env.sh 2、 修改 hbase site.xml 3 进入 hbase bin 目录下 执行 4 进入 hbase shell
阅读全文
摘要:1、写一个工具类用来生成 map reduce 实验 所需 input 文件 下面两个是原始文件 matrix1.txt matrix2.txt package com.ghc.hadoop.mapper; import org.apache.hadoop.io.LongWritable; impo
阅读全文
摘要:"原文链接" 最近几年IT技术的发展真的是日新月异,什么云计算、大数据、机器学习、AI等等名词层出不穷。多数程序员内心其实是恐慌的,我也时常会感到危机感。每每看到“xx培训,大数据就业,钱景好”我嘴上说不要,身体还是很诚实的。 大数据已经深入我们的生活当中,今天呢我们也不聊4个V(Volume 规模
阅读全文
摘要:"原文章链接" 什么FAT,NTFS,NFS,DAS,SAN,NAS,OSD这些名词我一个都不认识。 不知道各位大佬对上面的名词了解多少,通过上面的一些名词其实可以大致的看到存储是怎样一步步发展的。其中FAT,NTFS和NFS都是支持特定存储协议的存储系统,DAS,SAN,NAS,OSD是一种存储模
阅读全文
摘要:"原文章链接" 你肯定听过Hadoop,对就是那头奔跑的小象。 图片描述 Hadoop作为大数据时代代表性的解决方案被大家所熟知,它主要包含两部分内容: HDFS分布式文件存储 MapReduce分布式计算框架 前面我们分析存储方案的发展的时候有提到分布式文件存储的出现是为了解决存储的三大问题:可扩
阅读全文
摘要:安装单机版 hadoop 步骤 搭建伪分布式集群 (至少 三台服务器) clone 单机版后 修改 如下信息 搭建全分布式集群 配置 core site.xml 差不多有 六个 xml 文件需要配置 分模块启动 安装 jdk 1.8 下载解压 "hadoop" 测试是否安装成功,启动 hadoop
阅读全文
摘要:最近确定了自己未来职业规划。。。我要朝着大数据开发工程师努力,看下面的图谱,还差十万八千里(虽然不是所有都要会)!不过我不会气馁!加油!!! "路线2"
阅读全文
摘要:HIVE和HBASE区别 1. 两者分别是什么? Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够
阅读全文


浙公网安备 33010602011771号