会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
青紫天涯
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
下一页
2019年7月2日
kafka学习知识点总结(四)
摘要: 代码调试过程中遇到的错误总结: 在代码编写的过程中,IDEA并没有自动识别方法Subscribe需要导入的jar包,但是该方法的jar已经有maven下载,在这个过程中,需要去查看jar类中的所有方法,手动去导入实现。 在import org.apache.spark.streaming.kafka
阅读全文
posted @ 2019-07-02 05:07 青紫天涯
阅读(578)
评论(0)
推荐(0)
2019年6月28日
kafka学习知识点总结(三)
摘要: Kafka Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/
阅读全文
posted @ 2019-06-28 13:27 青紫天涯
阅读(311)
评论(0)
推荐(0)
kafka学习知识点总结(二)
摘要: 一、kafka配置文件中相关配置项说明(server.properties) 创建启动kafka的综合脚本 配置KAFKA_HOME 创建一键启动脚本文件 创建三个脚本 给予权限 验证安装 我们的验证步骤有两个。 第一步,分别在三台机器上使用下面命令查看是否有 Kafka 和 zookeeper 相
阅读全文
posted @ 2019-06-28 04:06 青紫天涯
阅读(306)
评论(0)
推荐(0)
2019年6月27日
kafka学习知识点总结(一)
摘要: kafka + sparkStreaming 有什么好处: 1、解耦 2、缓冲 (系统之间解耦合、峰值压力缓冲、异步通信) kafka消息队列的特点: 可靠性保证: 自己不丢数据,消费者不丢数据 消息系统的特点:生产者消费者模式 ,FIFO --partition内部是FIFO的,partition
阅读全文
posted @ 2019-06-27 18:36 青紫天涯
阅读(253)
评论(0)
推荐(0)
2019年6月26日
Spark Streaming HA
摘要: Driver HA: 1、在提交application的时候,添加 --supervise 选项,如果Driver挂掉,会自动启动一个Driver 2、代码层面恢复Driver 3、在恢复checkpoint中数据的时候,把旧的逻辑也一起给恢复了 主要的作用就是当SparkStreaming 停机之
阅读全文
posted @ 2019-06-26 15:36 青紫天涯
阅读(307)
评论(0)
推荐(0)
spark streaming 统计wordcount
摘要: spark streaming 学习: spark streaming 与strom 的区别: Spark Streaming 与strom 的区别: 1、Strom是纯实时的流式处理框架,SparkStreaming 是准实时处理框架(微批处理),因为微批处理,SparkStreaming 的吞吐
阅读全文
posted @ 2019-06-26 14:27 青紫天涯
阅读(1491)
评论(0)
推荐(0)
2019年6月21日
spark UDAF 函数解决
摘要: UDAF函数用户自定义函数: 用java代码实现UDAF函数 UDAF函数实现时,方法UserDefinedAggregateFunction的八个需要实现方法的作用如上代码中注释,其中最重要的三个方法是: update: 对相同元素进行合并时,row个数的更新 merge: shuffer归并的时
阅读全文
posted @ 2019-06-21 20:11 青紫天涯
阅读(679)
评论(0)
推荐(0)
2019年6月19日
spark sql 源码学习Dataset(三)structField、structType、schame
摘要: 1、structField 源码结构: A field inside a StructTypename:The name of this field.dataType:The data type of this field.nullable:Indicates if values of this f
阅读全文
posted @ 2019-06-19 16:31 青紫天涯
阅读(8012)
评论(0)
推荐(0)
2019年6月6日
spark连接mysql数据库的几种方式
摘要: 一、spark连接mysql数据库的第一种方式: 二、第二种读取mysql数据的方式 三、第三种读取mysql 的方式 四、将spark中的数据传输到mysql数据库 一个重要的参数: 参数: spark.sql.shuffle.partitions指定sql执行时,解析成sparkjob的分区数。
阅读全文
posted @ 2019-06-06 13:53 青紫天涯
阅读(26943)
评论(1)
推荐(1)
2019年5月29日
Linux环境下应用生成图片中出现乱码的问题处理
摘要: 问题: 用java生成图片上传到linux服务器,中文出现乱码问题解决 思路: 查看本地java字符集编码格式 查看linux服务器字符集编码 如果编码格式不一致会导致程序在服务器运行时报错 解决: 1、查看linux服务器字符集编码格式: echo $LANG 修改linux服务器字符集编码格式的
阅读全文
posted @ 2019-05-29 09:56 青紫天涯
阅读(3819)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
下一页
公告