会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
大数据流动
公众号 大数据流动。 追随大数据的流动,专注于大数据相关技术。 相关学习交流群已经成立,欢迎加入~
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
24
下一页
2021年10月29日
数据治理之元数据管理的利器——Atlas入门宝典
摘要: 随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富,也不够详细。所以整理了这份文档供大家学习使用。 本文档基于Atlas2.1.0版本,整理自部分官网内容,各种博客及实践
阅读全文
posted @ 2021-10-29 15:07 独孤风
阅读(13822)
评论(3)
推荐(0)
2021年10月25日
Github 29K Star的开源对象存储方案——Minio入门宝典
摘要: 对象存储不是什么新技术了,但是从来都没有被替代掉。为什么?在这个大数据发展迅速地时代,数据已经不单单是简单的文本数据了,每天有大量的图片,视频数据产生,在短视频火爆的今天,这个数量还在增加。有数据表明,当今世界产生的数据,有80%是非关系型的。那么,对于图片,视频等数据的分析可以说是大数据与人工智能
阅读全文
posted @ 2021-10-25 13:09 独孤风
阅读(7065)
评论(0)
推荐(0)
2021年9月26日
万字长文|大数据学前准备之Linux入门笔记(附资料)
摘要: 对于大数据学习而言,Linux运维可以说是必备的技能。可以不研究的过于高深,但是基本的操作和使用一定要熟练。Linux的学习需要大量的实践,本文从linux的基本知识,实战操作,到常用的指令与软件安装等都有总结。 也是为了在掌握Linux的同时,也为今后的大数据学习做好准备。文章较长,建议收藏。 相
阅读全文
posted @ 2021-09-26 10:53 独孤风
阅读(346)
评论(0)
推荐(0)
2021年9月24日
未来已来!华为《智能世界2030》报告解读(附下载)
摘要: 近日华为发布了《智能世界2030》报告,探索未来十年的趋势。华为汪涛以“无界探索,翻开未来”为主题演讲。本文带大家来看一下这份124页的报告主要讲了什么内容,同时也关注下和大数据发展的关系。 报告全文从医、食、住、行、城市、企业、能源和数据可信等八个领域展望了2030年一些可能的变化,引用了一些预测
阅读全文
posted @ 2021-09-24 08:59 独孤风
阅读(6956)
评论(6)
推荐(0)
2021年9月18日
万字长文|Hadoop入门笔记(附资料)
摘要: 大数据迅速发展,但是Hadoop的基础地位一直没有改变。理解并掌握Hadoop相关知识对于之后的相关组件学习有着地基的作用。本文整理了Hadoop基础理论知识与常用组件介绍,虽然有一些组件已经不太常用。但是理解第一批组件的相关知识对于以后的学习很有帮助,未来的很多组件也借鉴了之前的设计理念。 文章较
阅读全文
posted @ 2021-09-18 10:43 独孤风
阅读(837)
评论(0)
推荐(0)
2021年9月15日
大数据最后一公里——2021年五大开源数据可视化BI方案对比
摘要: 个人非常喜欢这种说法,最后一公里不是说目标全部达成,而是把整个路程从头到尾走了一遍。 大数据在经过前几年的野蛮生长以后,开始与数据中台的概念一同向着更实际的方向落地。有人问,数据可视化是不是等同于数据大屏。数据大屏是数据可视化的一部分,其承载更多的是展示与监控的功能。 而真正对业务产生影响的,确是比
阅读全文
posted @ 2021-09-15 13:32 独孤风
阅读(4708)
评论(0)
推荐(5)
2021年9月14日
非结构化数据怎么存?——开源对象存储方案介绍
摘要: 过去的相当长的一段时间里,商用对象存储占据了市场上的大量的份额。国外的Amazon S3,国内的阿里云OSS都成为了大多数公司的选择。但是构建一个企业级的数据湖(包括结构化和非结构化数据)已经成为了越来越多公司的目标。那么Hadoop还能满足我们的要求吗?还是我们需要更多的选择? 存储方案 如图所示
阅读全文
posted @ 2021-09-14 09:22 独孤风
阅读(2715)
评论(0)
推荐(0)
2021年9月13日
(三、四)Superset 1.3图表篇——透视表-Pivot Table
摘要: 本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布,趋势,地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化,而之前也一直没有做过非常细致的图表教程。 而且目前可以参考的资料有限,大部分还需要自己探索。所以本系列文章将对这59张图表的使用做一个整理。 Supe
阅读全文
posted @ 2021-09-13 10:29 独孤风
阅读(1494)
评论(1)
推荐(0)
2021年9月10日
数据湖搭建指南——几个核心问题
摘要: 1、什么是数据湖? 数据湖是一种技术系统,可以大批量并且廉价的分析结构化和非结构化数据资产。 其实很简单,数据湖的最大魅力在于可以分析一切类型的数据。 自 2010 年首次提出“数据湖”一词以来,采用数据湖架构的组织数量呈指数级增长。 它们支持多种分析功能,从数据的基本 SQL 查询到实时分析,再到
阅读全文
posted @ 2021-09-10 10:38 独孤风
阅读(2078)
评论(0)
推荐(1)
2021年9月9日
(二)Superset 1.3图表篇——Time-series Table
摘要: (二)Superset 1.3图表篇——Time-series Table 本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布,趋势,地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化,而之前也一直没有做过非常细致的图表教程。 而且目前可以参考的资料有限,大部
阅读全文
posted @ 2021-09-09 10:11 独孤风
阅读(1441)
评论(0)
推荐(1)
上一页
1
2
3
4
5
6
7
8
9
10
···
24
下一页
公告