会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
侠客云
博客园
首页
新随笔
联系
管理
订阅
随笔分类 -
大数据
1
2
3
下一页
2. scala spark wordcount
摘要:Spark 版本为 3.0.0,默认采用的 Scala 编译版本为 2.12 1. idea 增加 Scala 插件 2. 添加依赖
阅读全文
posted @
2023-10-26 22:08
冰底熊
阅读(5)
评论(0)
推荐(0)
kafka集群启停脚本
摘要:#! /bin/bash case $1 in "start"){ for i in hadoop102 hadoop103 hadoop104 do echo " 启动 $i Kafka " ssh $i "/opt/module/kafka/bin/kafka-server-start.sh -
阅读全文
posted @
2023-10-26 22:04
冰底熊
pyspark 环境搭建和相关操作redis ,es
摘要:pyspark学习官网:https://spark.apache.org/docs/latest/api/python/index.html 一.环境搭建 参考官网:https://spark.apache.org/docs/latest/api/python/user_guide/python_p
阅读全文
posted @
2023-08-03 23:33
冰底熊
阅读(370)
评论(0)
推荐(0)
hadoop集群搭建
摘要:1. 安装jdk和hadoop,解压jdk 和hadoop 包 2. 添加环境变量 vim /etc/profile.d/my_env.sh 3. source /etc/profile hadoop 完全分布式搭建 xsync 集群分发脚本,期望脚本在任何路径都能使用 echo $PATH 所以可
阅读全文
posted @
2022-01-15 22:52
冰底熊
spark 操作redis(scala)
该文被密码保护。
posted @
2022-01-06 23:50
冰底熊
对象和类
摘要:1.包对象 创建包对象 package com.deng /* * 包对象 * 包对象名称必须和当前的包名一致 * 申明用:package object * * */ package object test { // 定义当前包共享的属性和方法 val commonValue="公共值" } 包对象
阅读全文
posted @
2022-01-05 08:33
冰底熊
scala Map 操作
摘要:两个map key值相同时,相加操作 import scala.collection.mutable class Moshipipei { def main(args: Array[String]): Unit = { val map1 = Map("a" -> 1, "b" -> 3, "c" -
阅读全文
posted @
2022-01-03 12:36
冰底熊
scala模式匹配
该文被密码保护。
posted @
2022-01-03 12:19
冰底熊
阅读(2)
评论(0)
推荐(0)
scala伴生对象-单例模式
摘要:1.伴生对象 package com.deng.scala object Test1 { def main(args: Array[String]): Unit = { val s1 = Student.newObj("ling",23) val s2 = Student("ling",23) pr
阅读全文
posted @
2021-12-28 08:29
冰底熊
mr Wordcount 程序
摘要:1.创建maven项目 2.编写mr 程序 1.添加maven 依赖和插件 <dependencies> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version
阅读全文
posted @
2021-10-14 23:42
冰底熊
pyspark -partitionBy 案例
摘要:from pyspark import SparkConf,SparkContext from pyspark.sql import SparkSession import json def make_data(line): data = json.loads(line) h = data.get(
阅读全文
posted @
2021-09-17 07:30
冰底熊
spark 提交
摘要:#!/bin/bash num_executors=100 executor_memory=4g executor_cores=20 principal=BotSpider queue=DB_QUEUE keytab=/opt/keys/user.keytab python_path="hdfs:/
阅读全文
posted @
2021-09-16 22:21
冰底熊
hsql 小鹏汽车面试
摘要:小鹏汽车充电有两种类型,快充、慢充,有如下数据:车辆ID 充电时间 充电类型 a 20200601 19:21:09 1a 20200611 11:30:09 1a 20200621 21:10:09 0a 20200701 19:01:09 1a 20200701 20:30:09 1a 2020
阅读全文
posted @
2021-09-09 00:44
冰底熊
阅读(18)
评论(0)
推荐(0)
Hsql 连续多天登录问题
该文被密码保护。
posted @
2021-09-08 22:29
冰底熊
hive相关累加
该文被密码保护。
posted @
2021-09-03 08:17
冰底熊
hsql-排序(rank ,dense_rank,row_number)
摘要:题目: 1.原始数据: 1,3.50 2,3.65 3,4.00 4,3.85 5,4.00 6,3.65 2.创建表,导入数据 create table sc(id string,score float) row format delimited fields terminated by ',';
阅读全文
posted @
2021-09-01 23:38
冰底熊
hsql-蚂蚁森林
摘要:一.原始数据 u_001,2020/1/1,10 u_001,2020/1/2,150 u_001,2020/1/2,110 u_001,2020/1/2,10 u_001,2020/1/4,50 u_001,2020/1/4,10 u_001,2020/1/6,45 u_001,2020/1/6,
阅读全文
posted @
2021-08-31 00:53
冰底熊
hive 启停脚本
摘要:1.启动mysql 2. 启动meatstore 3.启动hiveserver2 启停脚本如下: my_hive.sh #!/bin/bash ## 启动mysql服务 systemctl start mariadb function start(){ ps -ef|grep $1|grep -v
阅读全文
posted @
2021-08-29 23:47
冰底熊
datax 安装和使用
摘要:官网:https://github.com/alibaba/DataX 下载地址:http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz 安装 1. 下载安装包: wget http://datax-opensource.o
阅读全文
posted @
2021-08-29 16:28
冰底熊
阅读(707)
评论(0)
推荐(0)
sqoop
该文被密码保护。
posted @
2021-08-06 23:12
冰底熊
阅读(1)
评论(0)
推荐(0)
1
2
3
下一页
公告