09 2021 档案
摘要:一、Hive基本概念 hive简介 由 Facebook 开源用于解决海量结构化日志的数据统计工具。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能。 Hive本质:讲HQL转化成MapReduce程序。 处理的数据存储再HDFS
阅读全文
摘要:个人PSP(四则运算) 题目要求:能自动生成小学四则运算题目,且每一道题目的运算结果不能为负。除了支持整数运算外,还要支持真分数四则运算。 工具清单: Java,Js,Maven,Tomcat,MySQL PSP表格 预计耗时(分钟) 实际耗时(分钟) Planning 计划 20 20 Estim
阅读全文
摘要:个人学习笔记,内容来源尚硅谷大学 一、HDFS定义 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 HDFS(Hadoop
阅读全文
摘要:仅是个人学习记录,内容来源尚硅谷大学 1、Hadoop是什么 Hadoop是一个由Apache基金会所开发的分布式系统基础框架。主要解决,海量数据的存储和海量数据的分析计算问题。广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。 2、Hadoop优势 高可靠性:Hadoop底层
阅读全文

浙公网安备 33010602011771号