1.Spark 概念

Apache Spark是一个大规模数据处理的统一分析引擎。

Apache Spark运行工作载荷在100倍速以上。

Apache Spark的组件包括:Spark SQL、Spark Streaming、MLib、GraphX。

Apache Spark应用模式:standalone、cluster mode, on EC2, on Hadoop YARN, on Mesos, or on Kubernetes

Apache Spark可存取数据: Access data in HDFS, Alluxio, Apache Cassandra, Apache HBase, Apache Hive, and hundreds of other data sources。

 

Apache Spark主页: http://spark.apache.org/

 

 

posted @ 2020-02-22 11:15  野火春风  阅读(81)  评论(0)    收藏  举报