摘要: 一、概述 Scala是一门多范式的编程语言,一种类似java的编程语言 ,设计初衷是实现可伸缩的语言 、并集成面向对象编程和函数式编程的各种特性。Spark就是使用Scala编写的。因此为了更好的学习大数据开发, 需要掌握Scala这门语言,当然Spark的兴起,也带动Scala语言的发展!官方文档 阅读全文
posted @ 2022-05-14 18:08 大数据老司机 阅读(543) 评论(0) 推荐(0)
摘要: 一、概述 复合事件处理(简称Complex Event Processing:CEP)是一种基于动态环境中事件流的分析技术,事件在这里通常是有意义的状态变化,通过分析事件间的关系,利用过滤、关联、聚合等技术,根据事件间的时序关系和聚合关系制定检测规则,持续地从事件流中查询出符合要求的事件序列,最终分 阅读全文
posted @ 2022-05-14 17:04 大数据老司机 阅读(1673) 评论(0) 推荐(0)
摘要: 一、git概述 Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。 Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。 Git 与常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式版本库 阅读全文
posted @ 2022-05-14 01:11 大数据老司机 阅读(1486) 评论(0) 推荐(0)