摘要: 1.2 Hadoop快速入门 1、Hadoop简介 Hadoop是一个开源的分布式计算平台。 提供功能:利用服务器集群,根据用户定义的业务逻辑,对海量数据的存储(HDFS)和分析计算(MapReduce) 2、Hadoop核心组件 Common——基础组件 HDFS——分布式文件存储系统 MapRe 阅读全文
posted @ 2022-08-06 13:59 安徽渣渣辉 阅读(61) 评论(0) 推荐(0)
摘要: 1.1 大数据概论 1、什么是大数据 从字面意思理解,大数据指的是巨量数据。计量单位已经超过TB级别发展到PB、EB、ZB、YB甚至BB级别。进制:1024 大数据是指在一定时间内无法用传统数据库软件工具采集、存储、管理和分析其内容的数据集合。 从技术角度来看,大数据技术的战略意义不在于掌握庞大的数 阅读全文
posted @ 2022-08-06 13:51 安徽渣渣辉 阅读(530) 评论(0) 推荐(0)