会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
cac2020
博客园
首页
新随笔
管理
上一页
1
···
18
19
20
21
22
23
24
25
26
···
41
下一页
2019年4月24日
【SparkStreaming学习之三】 SparkStreaming和kafka整合
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、receiver模式 1、receiver模式理解在SparkStreaming程序运
阅读全文
posted @ 2019-04-24 17:08 cac2020
阅读(938)
评论(1)
推荐(1)
2019年4月23日
【kafka学习之一】 kafka初识
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4一、kafka是什么? (1)kafka是一个高吞吐的分部式消息系统.(2)消息列队常见应用场景:系统之间解耦合;峰值压力缓冲;异步通信; 二、kafka特点:1、生产者消
阅读全文
posted @ 2019-04-23 17:01 cac2020
阅读(400)
评论(0)
推荐(0)
2019年4月22日
【SparkStreaming学习之二】 SparkStreaming算子操作
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、output operation算子1、foreachRDD:必须对抽取出来的RDD执
阅读全文
posted @ 2019-04-22 15:37 cac2020
阅读(971)
评论(0)
推荐(0)
2019年4月18日
【SparkStreaming学习之一】 SparkStreaming初识
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、SparkStreaming简介SparkStreaming是流式处理框架,是Spar
阅读全文
posted @ 2019-04-18 10:37 cac2020
阅读(483)
评论(0)
推荐(0)
2019年4月16日
【Spark-SQL学习之三】 UDF、UDAF、开窗函数
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、UDF:用户自定义函数。可以自定义类实现UDFX接口 示例代码:Java: Scala
阅读全文
posted @ 2019-04-16 16:15 cac2020
阅读(886)
评论(0)
推荐(0)
【Spark-SQL学习之二】 SparkSQL DataFrame创建和储存
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 1、读取json格式的文件创建DataFrame注意:(1)json文件中的json数据不
阅读全文
posted @ 2019-04-16 16:13 cac2020
阅读(2031)
评论(0)
推荐(0)
2019年4月11日
【Spark-SQL学习之一】 SparkSQL
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、SharkShark是基于Spark计算框架之上且兼容Hive语法的SQL执行引擎,由
阅读全文
posted @ 2019-04-11 15:07 cac2020
阅读(686)
评论(0)
推荐(0)
2019年4月10日
【Spark-core学习之九】 Spark案例
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、PV & UV PV是网站分析的一个术语,用以衡量网站用户访问的网页的数量。对于广告主
阅读全文
posted @ 2019-04-10 17:21 cac2020
阅读(888)
评论(0)
推荐(0)
【Spark-core学习之八】 SparkShuffle & Spark内存管理
摘要: 【Spark-core学习之八】 SparkShuffle & Spark内存管理环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、Sp
阅读全文
posted @ 2019-04-10 10:16 cac2020
阅读(391)
评论(0)
推荐(0)
2019年4月9日
【Spark-core学习之七】 Spark广播变量、累加器
摘要: 环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark-1.6 一、广播变量 注意: (1) 能不能将一个RDD使用广播变量广播出去? 不能,因为RDD是
阅读全文
posted @ 2019-04-09 15:36 cac2020
阅读(305)
评论(0)
推荐(0)
上一页
1
···
18
19
20
21
22
23
24
25
26
···
41
下一页
公告