随笔分类 - spark
摘要:1. Storm是什么,怎么做,如何做的更好?Storm是一个开源的分布式实时计算系统,它可以简单、可靠地处理大量的数据流。Storm有很多应用场景,如实时分析、在线机器学习、持续计算、分布式RPC、ETL,等等。Storm支持水平扩展,具有高容错性,保证每个消息都会得到处理,而且处理速度很快(在一...
阅读全文
摘要:Spark is what:Spache Spark is an open source clustercomputing system that aims to make dataanalytics fast — both fast to run and fast towriteBDAS:meso...
阅读全文
摘要:1 IntelliJ IDEA是一款非常优秀的JAVA编辑器,是jetbrain开发的一个IDE,用于Java、Groovy、Scala等的开发,自称是当前最智能的Java开发环境(The most intelligent IDE for Java platform),相对于其他开发工具来说,其对于...
阅读全文
摘要:scala简介:scala基于JVM的FP+OO(函数编程和面向对象编程)• 静态类型• 和Java互操作解释器(interpreter)• 值与变量(val & var)• 函数(Function)scala安装:1. 官网下载下载http://www.scala-lang.org/downloa...
阅读全文
摘要:主要是先看MapReduce模型有什么问题?第一:需要写很多底层的代码不够高效,第二:所有的事情必须要转化成两个操作Map/Reduce,这本身就很奇怪,也不能解决所有的情况。其实Spark出现就是为了解决上面的问题。介绍一些Spark的起源。发自 2010年Berkeley AMPLab,发表在h...
阅读全文

浙公网安备 33010602011771号