摘要: RDD操作 词频统计 line = sc.textFile("file:///usr/local/spark/word.txt") wordCount = lines.flatMap(lambda line: line.split(" ").map(lambda word: (word,1)).re 阅读全文
posted @ 2020-03-07 16:54 Tanglement 阅读(1101) 评论(0) 推荐(0)
摘要: HBase安装 在HBase学习中有安装指导博客 创建HBase表 启动Hadoop、Spark 创建表 插入数据 Spark配置 下载jar包 把hbase/lib下的jar包拷贝到spark/jars目录下。 拷贝的jar包有:hbase .jar,guava 12.0.1.jar,htrace 阅读全文
posted @ 2020-03-07 11:10 Tanglement 阅读(483) 评论(0) 推荐(0)