水木青楓 - 博客园

2020年8月29日

摘要：面试总结： ##1、HDFS小文件小文件的产生原因 1）数据本身的特点：比如我们在 HDFS 上存储大量的图片、短视频、短音频等文件，这些文件本身较小，达不到一个block的大小，而且数量众多。 2） MapReduce产生：例如使用查询一张含有海量数据的表，然后存储在另外一张表中，而这个查询只阅读全文

posted @ 2020-08-29 15:29 水木青楓阅读(1026) 评论(0) 推荐(1)

2020年8月28日

【面试题】大数据开发岗位

摘要：某公司面试题： 1、阐述数据库的三大范式？ 2、Linux 自带的常用命令举例至少20个？ 3、Spark 有哪些聚合类的算子，我们应该尽量避免什么类型的算子？ 4、Hive 和 HBase 的区别？ 5、你了解设计模式吗？写出你知道的设计模式。 6、常见的GC算法有哪些？ 7、kafka 的数据存阅读全文

posted @ 2020-08-28 12:54 水木青楓阅读(663) 评论(0) 推荐(1)

2020年8月27日

Zookeeper常见面试题(附答案)(建议收藏)

摘要：前言 ZooKeeper 是一个分布式的，开放源码的分布式应用程序协调服务。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。 ZooKeeper 的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。 ZooK 阅读全文

posted @ 2020-08-27 22:15 水木青楓阅读(2662) 评论(0) 推荐(0)

2020年8月26日

【面试题】大数据从低级到高级的应用有哪些？

摘要：低级到高级：ods - dw - ads 有哪些应用数据整合数据仓库 BI 报表实时大屏展示数据标签用户画像 - 脸谱用户客群分析个性化推荐反洗钱金融风控 ... 阅读全文

posted @ 2020-08-26 23:47 水木青楓阅读(200) 评论(0) 推荐(0)

【面试题】如何选择大数据组件？

摘要：技术选型：一个优秀的大数据生态组件需要满足这些条件。阅读全文

posted @ 2020-08-26 23:11 水木青楓阅读(353) 评论(0) 推荐(1)

2020年8月25日

spark 中map 和 flatMap 的区别

摘要：代码如下： scala> sc.parallelize(Array("a_b","c_d","e_f")).foreach(println) a_b c_d e_f scala> sc.parallelize(Array("a_b","c_d","e_f")).map(string=>{string 阅读全文

posted @ 2020-08-25 17:30 水木青楓阅读(590) 评论(0) 推荐(0)

Spark-shell 报错：Failed to get database default, returning NoSuchObjectException

摘要： Spark-shell 执行sql查询报错： 20/08/24 15:33:59 WARN metastore.ObjectStore: Failed to get database default, returning NoSuchObjectException 20/08/24 15:34:03 阅读全文

posted @ 2020-08-25 10:48 水木青楓阅读(5498) 评论(0) 推荐(1)

Redis面试题

摘要：原作者：睶先森原文链接：https://blog.csdn.net/Butterfly_resting/article/details/89668661 面试题： 1、Redis 持久化机制 2、缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等问题 3、热点数据和冷数据是什么 4、Memcach 阅读全文

posted @ 2020-08-25 01:43 水木青楓阅读(168) 评论(0) 推荐(0)

2020年8月24日

Hadoop上小文件如何存储？

摘要： Block是文件块，HDFS中是以Block为单位进行文件的管理的，一个文件可能有多个块，每个块默认是3个副本，这些块分别存储在不同机器上。块与文件之前的映射关系会定时上报Namenode。HDFS中一个块的默认大小是64M，其大小由参数dfs.block.size控制。这里面先引申几个问题出来：阅读全文

posted @ 2020-08-24 17:57 水木青楓阅读(490) 评论(0) 推荐(0)

2020年8月23日

HDFS读写流程

摘要： HDFS读过程 HDFS API 读文件 Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(conf); Path file = new Path("demo.txt"); FSDataInputStre 阅读全文

posted @ 2020-08-23 23:49 水木青楓阅读(391) 评论(0) 推荐(0)

行勝於言

行勝於言desc

公告