数据储存:磁盘(共享) --|–SAN、NAS、DAS(专门将数据存储于磁盘阵列)|–分布式存储架构(HDFS)–集群(应用)H:HADOOP D:分布 FS:文件系统:Linux算法:1、map-reduces的数据处理集群:他是将海量数据按照一定的方式,修改为键值关系 HDFS + map-reduces = Hadoop集群(运行于Linux上的一个高性能集群)2、通过数学(统计学)+ Python = 算法3、数据可视化