关注我,每天一篇大数据开发面试文章,挺进大厂!2021年全套大数据面试题开始更新!

随笔分类 -  Flink

摘要:前言 今年有个现象,实时数仓建设突然就被大家所关注。我个人在公众号也写过和转载过几篇关于实时数据仓库的文章和方案。 但是对于实时数仓的狂热追求大可不必。 首先,在技术上几乎没有难点,基于强大的开源中间件实现实时数据仓库的需求已经变得没有那么困难。其次,实时数仓的建设一定是伴随着业务的发展而发展,武断 阅读全文
posted @ 2019-09-15 10:43 王知无 阅读(6034) 评论(2) 推荐(1)
摘要:在上一章节中,我们讲到实时数仓的建设,互联网大数据技术发展到今天,各个领域基本已经成熟,有各式各样的解决方案可以供我们选择。 在实时数仓建设中,解决方案成熟,消息队列Kafka、Redis、Hbase鲜有敌手,几乎已成垄断之势。而OLAP的选择则制约整个实时数仓的能力。开源盛世的今天,可以供我们选择 阅读全文
posted @ 2019-09-15 10:39 王知无 阅读(9552) 评论(0) 推荐(2)
摘要:关注我的公众号,后台回复【JAVAPDF】获取200页面试题! "5万人关注的大数据成神之路,不来了解一下吗?" "5万人关注的大数据成神之路,真的不来了解一下吗?" "5万人关注的大数据成神之路,确定真的不来了解一下吗?" 欢迎您关注 "《大数据成神之路》" 愿读到这篇文章的技术人早日明白并且脱离 阅读全文
posted @ 2019-09-13 16:33 王知无 阅读(761) 评论(1) 推荐(0)
摘要:【声明】本文由《大数据技术与架构》读者提供,未经授权不得转载。 "5万人关注的大数据成神之路,不来了解一下吗?" "5万人关注的大数据成神之路,真的不来了解一下吗?" "5万人关注的大数据成神之路,确定真的不来了解一下吗?" 腾讯 关键词【Java基础】【数据结构】【操作系统】 【算法】【数据库】【 阅读全文
posted @ 2019-09-13 16:18 王知无 阅读(340) 评论(0) 推荐(0)
摘要:声明:本文参考了淘宝/滴滴/美团发表的关于大数据平台建设的文章基础上予以整理。参考链接和作者在文末给出。 在此对三家公司的技术人员无私奉献精神表示感谢,如果文章造成了侵权行为,请联系本人删除。本人在尊重事实的基础上重新组织了语言和内容,旨在给读者揭开一个完善的大数据平台的组成和发展过程。 本文在未经 阅读全文
posted @ 2019-09-13 16:13 王知无 阅读(837) 评论(0) 推荐(0)
摘要:Flink零基础入门 "Flink入门" "Flink DataSet&DataSteam API" "Flink集群部署" "Flink重启策略" "Flink分布式缓存" "Flink重启策略" "Flink中的Time" "Flink中的窗口" "Flink的时间戳和水印" "Flink广播变 阅读全文
posted @ 2019-08-29 20:33 王知无 阅读(2138) 评论(0) 推荐(0)
摘要:引言 Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。 对于Spark来说有3中Join的实现,每种Join对应着不同的应用场景: Broadcast Hash Join :适合一张较 阅读全文
posted @ 2019-07-25 22:03 王知无 阅读(2875) 评论(0) 推荐(0)
摘要:1.redis是用来干嘛的? Redis is an open source (BSD licensed), in memory data structure store, used as a database, cache and message broker. It supports data 阅读全文
posted @ 2019-07-25 09:09 王知无 阅读(598) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:54 王知无 阅读(972) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:53 王知无 阅读(2341) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:52 王知无 阅读(1513) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:51 王知无 阅读(953) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:50 王知无 阅读(452) 评论(0) 推荐(0)
摘要:分布式缓存 Flink提供了一个分布式缓存,类似于hadoop,可以使用户在并行函数中很方便的读取本地文件,并把它放在taskmanager节点中,防止task重复拉取。此缓存的工作机制如下:程序注册一个文件或者目录(本地或者远程文件系统,例如hdfs或者s3),通过ExecutionEnviron 阅读全文
posted @ 2019-04-27 19:50 王知无 阅读(3405) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:49 王知无 阅读(1162) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:47 王知无 阅读(28105) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:45 王知无 阅读(1056) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:44 王知无 阅读(1775) 评论(0) 推荐(0)
摘要:戳更多文章: 1-Flink入门 2-本地环境搭建&构建第一个Flink应用 3-DataSet API 4-DataSteam API 5-集群部署 6-分布式缓存 7-重启策略 8-Flink中的窗口 9-Flink中的Time Flink时间戳和水印 Broadcast广播变量 FlinkTa 阅读全文
posted @ 2019-04-27 19:43 王知无 阅读(4286) 评论(2) 推荐(0)
摘要:已经更新100+篇~ 关注公众号,BAT大神带你飞~ 听说你还在写Java,看Spring,看Dubbo,今天SpringCloud, 明天Dubbo3.X新版本... 10个开发9个半在写Java后台?框架层出不穷,天天学新东西怕被甩淘汰︿( ̄︶ ̄)︿ 本文旨在为普通程序员(Java程序员最佳)提 阅读全文
posted @ 2019-04-25 22:54 王知无 阅读(537) 评论(1) 推荐(1)