摘要: 利用mapWithState算子实现有状态的wordCount,且按照word的第一个字母为key,但是要求输出的格式为(word,1)这样形式的结果 阅读全文
posted @ 2019-07-07 13:22 icecola 阅读(1140) 评论(0) 推荐(0) 编辑
摘要: 在进行Spark Streaming的开发时,我们常常需要将DStream转为DataFrame来进行进一步的处理, 共有两种方式,方式一: 利用map算子和tuple来完成,一般的场景下采用这种方式即可。 但是有的时候我们会遇到列数大于22的情况,这个时候会受到scala的tuple数不能超过22 阅读全文
posted @ 2019-07-12 16:01 icecola 阅读(2376) 评论(0) 推荐(0) 编辑
摘要: org.apache.spark.SparkException: Job aborted due to stage failure: Task 1 in stage 29.1 failed 4 times, most recent failure: Lost task 1.3 in stage 29 阅读全文
posted @ 2019-07-11 20:36 icecola 阅读(472) 评论(0) 推荐(0) 编辑
摘要: 基础知识 编程语言:java python c 基本算法 网络知识 设计模式 工具方面 操作系统 linux 代码管理 SVN/Git 持续集成(CI/CD):jenkins 框架方面 应用层框架 ssh :过时 ssm spring springmvc mybatis spring boot 各种 阅读全文
posted @ 2019-04-27 11:04 icecola 阅读(284) 评论(0) 推荐(0) 编辑