2024.11.19

实验7

Spark初级编程实践

1.实验目的

（1）掌握使用Spark访问本地文件和HDFS文件的方法

（2）掌握Spark应用程序的编写、编译和运行方法

（1）操作系统：Ubuntu18.04（或Ubuntu16.04）；

（2）Spark版本：2.4.0；

（3）Hadoop版本：3.1.3。

（1）在spark-shell中读取Linux系统本地文件“/home/hadoop/test.txt”，然后统计出文件的行数；

启动spark

val localFilePath = "file:///home/hadoop/test.txt"

val localFile = spark.read.textFile(localFilePath)

val localLineCount = localFile.count()

println(s"Local file line count: $localLineCount")

posted @ 2024-11-19 09:18 kuku睡阅读(14) 评论(0) 收藏举报

刷新页面返回顶部