随笔分类 -  大数据

摘要:大数据时代,数据仓库究竟是干嘛的?前言 无论你是否专门从事大数据开发,作为一个开发人员,应该都听说过数据仓库的概念,那你知道为什么会出现数据仓库?数据仓库究竟是干嘛的吗?有什么价值和意义呢?那么本文就带到入门,揭开数据仓库的面纱。 数据仓库的由来 数据仓库为何而来,主要解决什么问题的? 先下结论:为了分析数据而来,分析结果为企业决策 阅读全文
posted @ 2022-12-12 14:09 JAVA旭阳 阅读(1147) 评论(0) 推荐(3)
摘要:Hadoop如何保证自己的江湖地位?Yarn功不可没前言 任何计算任务的运行都离不开计算资源,比如CPU、内存等,那么如何对于计算资源的管理调度就成为了一个重点。大数据领域中的Hadoop之所以一家独大,深受市场的欢迎,和他们设计了一个通用的资源管理调度平台Yarn密不可分,那Yarn是如何做进行资源管理的呢?它的通用性体现在哪里呢?它是如何保证Ha 阅读全文
posted @ 2022-12-11 10:15 JAVA旭阳 阅读(263) 评论(0) 推荐(0)
摘要:分布式计算MapReduce究竟是怎么一回事?前言 如果要对文件中的内容进行统计,大家觉得怎么做呢?一般的思路都是将不同地方的文件数据读取到内存中,最后集中进行统计。如果数据量少还好,但是面对海量数据、大数据的场景这样真的合适吗?不合适的话,那有什么比较好的方式进行计算呢?不急,看完本文给你答案。 分布式计算思想 我们打开思路,既然文件数据遍布 阅读全文
posted @ 2022-12-10 17:51 JAVA旭阳 阅读(338) 评论(0) 推荐(0)
摘要:大数据HDFS凭啥能存下百亿数据?欢迎关注大数据系列课程 前言 大家平时经常用的百度网盘存放电影、照片、文档等,那有想过百度网盘是如何存下那么多文件的呢?难到是用一台计算机器存的吗?那得多大磁盘啊?显然不是的,那本文就带大家揭秘。 分布式存储思想 既然一台机器的存储所需的磁盘有上限瓶颈,那么我们能否利用多台机器形成一个整体用来存储呢 阅读全文
posted @ 2022-12-09 21:08 JAVA旭阳 阅读(306) 评论(0) 推荐(0)
摘要:当我们说大数据Hadoop,究竟在说什么?前言 提到大数据,大抵逃不过两个问题,一个是海量的数据该如何存储,另外一个就是那么多数据该如何进行查询计算呢。好在这些问题前人都有了解决方案,而Hadoop就是其中的佼佼者,是目前市面上最流行的一个大数据软件,那它包括哪些内容呢?有什么特点呢? Hadoop介绍 提到Hadoop,大家的理解是什么? 阅读全文
posted @ 2022-12-08 07:52 JAVA旭阳 阅读(88) 评论(0) 推荐(0)
摘要:上帝视角一览大数据开发体系前言 不知道大家有没有过在百度搜索旅游的关键字,不久就可能收到机票的推销的经验。如今是大数据的时代,数据的价值越来越重要。数据即资产,想必大家都听说过。最近公司的项目中也用到了一些大数据的技术,本文对大数据相关的知识体系做了一个整体的梳理。 什么是大数据 大数据,你可能就简单理解为数据量大,那是多大 阅读全文
posted @ 2022-12-07 10:58 JAVA旭阳 阅读(931) 评论(0) 推荐(4)