随笔分类 - 大数据
摘要:一、大数据与机器学习的关系 大数据技术是机器学习、深度学习和人工智能的基础,现有的机器学习和人工智能的发展都离不开大数据。 二、大数据生态圈 目前大数据主要有两大生态圈:》Hadoop生态圈》Spark生态圈 三、大数据产生的背景 由于信息时代的到来,每天都产生了大量的数据,想要靠人工去分析和挖掘这
阅读全文
摘要:1、Hadoop概述 1.1 Hadoop名字的由来 Hadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名 Hadoop的官网:http://hadoop.apache.org 。 1.2 Hadoop介绍 Hadoop是Apache的一个顶级项目、是开源的、分布式存储+分布式计算平台;
阅读全文
摘要:1、Apache Hadoop 不足之处 • 版本管理混乱 • 部署过程繁琐、升级过程复杂 • 兼容性差 • 安全性低 2、Hadoop 发行版 • Apache Hadoop • Cloudera’s Distribution Including Apache Hadoop(CDH) • Hort
阅读全文
摘要:2014 年,马云提出,“人类正在从 IT 时代走向 DT 时代”。如果说在 IT 时代是以自我控制、自我管理为主,那么到了 DT(Data Technology) 时代,则是以服务大众、激发生产力为主。 在 DT 时代,人们比以往任何时候更能收集到更丰富的数据。数据正在变革我们的生活,催生了大数据
阅读全文

浙公网安备 33010602011771号