02 2021 档案

摘要:在利用数据仓库进行数据处理时,通常有这样一个业务场景,为一个Hive表新增一列自增字段(比如 阅读全文
posted @ 2021-02-26 17:49 大数据学习与分享 阅读(1149) 评论(0) 推荐(0)
摘要:如果你比较熟悉JavaWeb应用开发,那么对Spring框架一定不陌生,并且JavaWeb通常是基于SSM搭起的架构,主要用Java语言开发。但是开发Spark程序,Scala语言往往必不可少。众所周知 阅读全文
posted @ 2021-02-24 17:56 大数据学习与分享 阅读(994) 评论(0) 推荐(0)
摘要:对于Spark的初学者,往往会有一个疑问:Spark(如SparkRDD、SparkSQL)在处理数据的时候,会将数据都加载到内存再做处理吗? 阅读全文
posted @ 2021-02-22 09:07 大数据学习与分享 阅读(809) 评论(0) 推荐(0)
摘要:通过《Linux系统层面调优和常见的面试题》,笔者详细介绍了Linux系统层面常用的调优方法和常见的面试题。本篇文章将介绍常用的进行性能检测的Linux命令 阅读全文
posted @ 2021-02-20 17:40 大数据学习与分享 阅读(655) 评论(0) 推荐(3)
摘要:从概念到使用、从基础到原理、从示例到实战的讲解一个技术,并会结合一些实际中当运用这些技术时遇到的问题 阅读全文
posted @ 2021-02-09 13:10 大数据学习与分享 阅读(641) 评论(0) 推荐(0)
摘要:通过之前的文章《Kafka分区分配策略》和《Kafka高性能揭秘》,我们了解到:Kafka高吞吐量的原因之一就是通过partition将topic中的消息保存到Kafka集群中不同的broker中。无论是 阅读全文
posted @ 2021-02-03 11:32 大数据学习与分享 阅读(4447) 评论(0) 推荐(0)