会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
关注我,每天一篇大数据开发面试文章,挺进大厂!2021年全套大数据面试题开始更新!
王知无
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
9
下一页
2020年1月18日
周末毒鸡汤时间
摘要: 马上要过年了,很多小伙伴可能都已经回家或者准备回家了。 然后咱们周末就消停会,不看代码了,等除夕或者春节在学... 这两天帮着几个星球的球友和群里的小伙伴改了改简历,另外还有几个小伙伴私聊我问了几个问题。有两个同学特别诚恳,就多交流了几句,我也学到挺多东西,可能大家现在遇到的问题,我未来都会遇到,学
阅读全文
posted @ 2020-01-18 14:24 王知无
阅读(311)
评论(0)
推荐(0)
2020年1月15日
MySQL 8.0发布,你熟悉又陌生的Hash Join?
摘要: 昨天下午在查资料的时候,无意间点到了MySQL的官网。发现MySQL发布了一个新版本。 Mysql这个数据库有没有人不熟悉?不用的?没有吧。 2019年末,MySQL发布的8.0.18 GA版本,带来了一些新特性和增强功能。其中最引人注目的莫过于多表连接查询 支持Hash Join 。 还是老样子,
阅读全文
posted @ 2020-01-15 22:48 王知无
阅读(436)
评论(0)
推荐(0)
2020年1月14日
你可能需要的Kafka面试题与答案整理
摘要: 本文是根据平时面试以及网上资源进行的整理。希望对小伙伴们面试有帮助。 消息队列的作用和使用场景 通过异步处理提高响应时间,削峰填谷: 场景:数据比较集中且实时要求不是太高,如果同步处理,假如业务高峰需要4台服务支撑,那么在业务高峰过了之后,就会出现资源闲置,如果引入消息队列的话,将数据放到消息队列后
阅读全文
posted @ 2020-01-14 22:39 王知无
阅读(3766)
评论(0)
推荐(0)
如果你在准备面试,就好好看看这130道题
摘要: 这些题目是一个知识星球的球友发给我的,其中有几个题帮着解答了一下。希望对大家有帮助。 如果你不知道如何准备面试,那么看看这个。 年假马上来临,我相信有不少读者都在准备或者考虑面试,无论如何不妨收藏一下。 如果你某个题目不知道答案,那么就去搜一下,如果搜不到,在公众号回复【加群】,可以加到群里寻求小伙
阅读全文
posted @ 2020-01-14 21:46 王知无
阅读(578)
评论(0)
推荐(0)
2020年1月10日
Flink异步之矛盾-锋利的Async I/O
摘要: 维表JOIN 绕不过去的业务场景 在Flink 流处理过程中,经常需要和外部系统进行交互,用维度表补全事实表中的字段。 例如:在电商场景中,需要一个商品的skuid去关联商品的一些属性,例如商品所属行业、商品的生产厂家、生产厂家的一些情况; 在物流场景中,知道包裹id,需要去关联包裹的行业属性、发货
阅读全文
posted @ 2020-01-10 22:28 王知无
阅读(3608)
评论(1)
推荐(1)
2020年1月6日
Flink入门(三)——环境与部署
摘要: flink是一款开源的大数据流式处理框架,他可以同时批处理和流处理,具有容错性、高吞吐、低延迟等优势,本文简述flink在windows和linux中安装步骤,和示例程序的运行,包括本地调试环境,集群环境。另外介绍Flink的开发工程的构建。 首先要想运行Flink,我们需要下载并解压Flink的二
阅读全文
posted @ 2020-01-06 22:27 王知无
阅读(1105)
评论(0)
推荐(1)
Flink入门(二)——Flink架构介绍
摘要: 1、基本组件栈 了解Spark的朋友会发现Flink的架构和Spark是非常类似的,在整个软件架构体系中,同样遵循着分层的架构设计理念,在降低系统耦合度的同时,也为上层用户构建Flink应用提供了丰富且友好的接口。 https://mmbiz.qpic.cn/mmbiz_png/mqibsuEhdU
阅读全文
posted @ 2020-01-06 22:17 王知无
阅读(503)
评论(0)
推荐(0)
Flink入门(一)——Apache Flink介绍
摘要: Apache Flink是什么? 在当代数据量激增的时代,各种业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效的处理,成为当下大多数公司所面临的问题。随着雅虎对hadoop的开源,越来越多的大数据处理技术开始涌入人们的视线,例如目前比较流行的大数据处理引擎Apache Spar
阅读全文
posted @ 2020-01-06 22:15 王知无
阅读(387)
评论(0)
推荐(0)
2019年12月8日
Apache Spark在海致大数据平台中的优化实践
摘要: 本文来自由海致网络技术公司翟士丹分享。专注于大数据技术领域,Apache Spark Contributor,有丰富的Spark SQL引擎调优经验。 海致全称海致网络技术公司,成立于2013年7月。作为一家技术驱动的创业型公司,海致的创始班底拥有丰富的技术经验。核心团队成员来自百度、微软、IBM、
阅读全文
posted @ 2019-12-08 19:00 王知无
阅读(823)
评论(0)
推荐(0)
企业数据中台的建设
摘要: 本文围绕什么是数据中台,中台怎么建设,中台产品怎么选择,案例分析介绍企业级数据中台的建设。 什么是数据中台 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。 数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企
阅读全文
posted @ 2019-12-08 16:52 王知无
阅读(5654)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
9
下一页
公告