import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
object App {
  def main(args:Array[String])={
    val logFile = "file:///home/hadoop/cy/README.md" // Should be some file on your system
    val conf = new SparkConf().setAppName("Simple Application")
    val sc = new SparkContext(conf)
    val logData = sc.textFile(logFile, 2).cache()
    val numAs = logData.filter(line => line.contains("a")).count()
    val numBs = logData.filter(line => line.contains("b")).count()
    println("Lines with a: %s, Lines with b: %s".format(numAs, numBs))
  }
}

5.打包运行

命令行中进入project所在目录下，执行sbt package ,生成的jar包会出现在: <project path>/target/scala-2.10/sparktest_2.10-1.0.jar 。将jar包传到装有spark 1.6.0的机器上，运行 ./bin/spark-submit sparktest_2.10-1.0.jar。

哈哈极简试水版，欢迎纠错指正~~~~~~

posted on 2017-07-11 18:27 柚子da 阅读(232) 评论(0) 收藏举报

刷新页面返回顶部

导航