随笔分类 - 大数据
摘要:基于spark将关系型数据库数据导入hdfs,支持增量追加导入、覆盖导入和去重导入 package com.shenyuchong; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem
阅读全文
摘要:采集指定目录下文本数据到kafka 配置文件编写customer2kafka.conf maven打包执行: pom.xml
阅读全文
摘要:Spark官网下载Spark Spark下载,版本随意,下载后解压放入bigdata下(目录可以更改) 下载Windows下Hadoop所需文件winutils.exe 同学们自己网上找找吧,这里就不上传了,其实该文件可有可无,报错也不影响Spark运行,强迫症可以下载,本人就有强迫症~~,文件下载
阅读全文

浙公网安备 33010602011771号