《大数据技术原理与应用》第二版-第一章大数据概述
1.2大数据概念
- 数据量大
- 数据类型繁多
- 处理速度快
- 价值密度低
1.3大数据影响
- 研究变化经历了从实验到理论到计算再到数据
- 思维的变化
- 全样而非抽样
- 效率而非精准
- 相关而非因果
1.6大数据计算模式
- 批处理计算,主要针对于大规模的数据批量处理。MapReduce用于大规模的数据集(1TB)的并行运算。Spark是一个针对超大数据集合低延时的集群分布式计算系统,比MapReduce快许多。
- 流计算,流数据或数据流是指在时间分布和数量上无限的一系列动态数据集合,必须采用实时计算方式给出秒级响应。商业级平台:Streams、StreamBase;第二类是开源的计算平台,Storm、Yahoo、S4、Spark Streaming
- 图计算。Pregel是实现并行图处理系统,主要用于图遍历、最短路径、PageRank计算,还有其他Giraph、GraphX、PowerGraph、GoldenOrb、Hama
- 查询分析计算,需要提供实时或准实时的响应,谷歌的Dremel、Impala、Hive、Cassandra
1.8大数据与云计算
- 云计算包括三种典型的服务模式,IaaS(基础设施服务即计算资源和存储)、PaaS(平台即服务)、SaaS(软件即服务)
- 公有云、私有云、混合云
- 云计算关键技术:包括虚拟技术、分布式存储、分布式计算、多租户。
- 物联网是物物相连的互联网的延伸,他利用局部网络或者互联网等通信技术把传感器、控制器、机器、人员和物通过新的方式连接在一起,形成了人与物、物与物相连,实现信息化和远程管理控制。
作者:睿晞
身处这个阶段的时候,一定要好好珍惜,这是我们唯一能做的,求学,钻研,为人,处事,交友……无一不是如此。
劝君莫惜金缕衣,劝君惜取少年时。花开堪折直须折,莫待无花空折枝。
曾有一个业界大牛说过这样一段话,送给大家:
“华人在计算机视觉领域的研究水平越来越高,这是非常振奋人心的事。我们中国错过了工业革命,错过了电气革命,信息革命也只是跟随状态。但人工智能的革命,我们跟世界上的领先国家是并肩往前跑的。能身处这个时代浪潮之中,做一番伟大的事业,经常激动的夜不能寐。”
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.

浙公网安备 33010602011771号