【Spark机器学习速成宝典】基础篇01Windows下spark开发环境搭建（Scala版）

package com.itmorn.ml
import org.apache.spark.{SparkContext, SparkConf}
object wordCount {
  def main(args: Array[String]) {
    val conf = new SparkConf().setMaster("local").setAppName("wordCount")    //创建环境变量
    val sc = new SparkContext(conf)                                //创建环境变量实例
    val data = sc.textFile("data/wc.txt")                                //读取文件
    data.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println)    //word计数
  }
}

import org.apache.spark.sql.SparkSession
import org.apache.log4j.{Level, Logger}
object xgboostTest {
  Logger.getLogger("org").setLevel(Level.ERROR)
  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder()
      .master("local")
      .appName("SparkSessionZipsExample")
      .enableHiveSupport()
      .getOrCreate()

    val line = spark.sparkContext.textFile("wc")

    line.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println)

  }
}

返回目录

条目7

　　。

返回目录

条目8

　　。

返回目录

posted @ 2017-12-16 18:00 黎明程序员阅读(1474) 评论(0) 收藏举报

刷新页面返回顶部

黎明程序员

【Spark机器学习速成宝典】基础篇01Windows下spark开发环境搭建（Scala版）

目录

安装jdk

安装Scala IDE for Eclipse

配置Spark

配置Hadoop

创建Maven工程

Scala代码

条目7

条目8

条目9

公告