2019年12月3日
摘要: 大数据发展至今,数据呈指数倍的增长,对实效性的要求也越来越高,于是像上面这种需求也变得越来越多了。 那这些场景对应着什么业务需求呢?我们来总结下,大概如下: 初看这些需求,是不是感觉很难? 那么我们接下来来分析一下该怎么去实现? 从这些需求来看,最根本的业务都是需要实时查看数据信息,那么首先我们得想 阅读全文
posted @ 2019-12-03 15:37 xibuhaohao 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 1.前言 目前实时计算的业务场景越来越多,实时计算引擎技术及生态也越来越成熟。以Flink和Spark为首的实时计算引擎,成为实时计算场景的重点考虑对象。那么,今天就来聊一聊基于Kafka的实时计算引擎如何选择?Flink or Spark? 2.为何需要实时计算? 根据IBM的统计报告显示,过去两 阅读全文
posted @ 2019-12-03 15:20 xibuhaohao 阅读(436) 评论(0) 推荐(0) 编辑
摘要: 一分钟系列 潜在场景如何? 当MySQL单表的数据量过大时,数据库的访问速度会下降,“数据量大”问题的常见解决方案是“水平切分”。 MySQL常见的水平切分方案有哪些? (1)分库分表; (2)分区表。 画外音:我C,没听过分区表,有朋友惊叹。 什么是分库分表? 把一个很大的库(表)的数据分到几个库 阅读全文
posted @ 2019-12-03 14:43 xibuhaohao 阅读(968) 评论(0) 推荐(0) 编辑
摘要: 无论是 NoSQL,还是大数据领域,HBase 都是非常”炙热”的一门数据库。本文将对 HBase 做一些基础性的介绍,旨在入门。 一、简介 HBase 是一个开源的、面向列的非关系型分布式数据库,目前是Hadoop体系中非常关键的一部分。在最初,HBase是基于谷歌的 BigTable 原型实现的 阅读全文
posted @ 2019-12-03 10:56 xibuhaohao 阅读(879) 评论(0) 推荐(0) 编辑