摘要: 转自:https://blog.csdn.net/qq_26803795/article/details/79162203 为了保证效率和质量,每篇文章发布6个知识点,由简单及难,我们继续HIVE: 1)hive 支持 not in 吗? 2)Hive 有哪些方式保存元数据,各有哪些优缺点? 3)h 阅读全文
posted @ 2018-08-29 19:54 流氓小伙子 阅读(385) 评论(0) 推荐(0)
摘要: 转自:https://blog.csdn.net/qq_26803795/article/details/79161599 为了保证效率和质量,每篇文章发布6个知识点,由简单及难,我们继续Hbase的尾巴,并开始HIVE: 1)怎样将mysql的数据导入到hbase中? 2)hbase的快速查找建立 阅读全文
posted @ 2018-08-29 19:53 流氓小伙子 阅读(294) 评论(0) 推荐(0)
摘要: 转自:https://blog.csdn.net/qq_26803795/article/details/79152808 为了保证效率和质量,每篇文章发布6个知识点,由简单及难,我们继续Hbase: 1)hive 跟 hbase 的区别是? 2)HBase 接收数据,如果短时间导入数量过多的话就会 阅读全文
posted @ 2018-08-29 19:51 流氓小伙子 阅读(307) 评论(0) 推荐(0)
摘要: 转自:https://blog.csdn.net/qq_26803795/article/details/79142512 为了保证效率和质量,每篇文章发布6个知识点,由简单及难,下面我们开始Hbase: 1)介绍一下 hbase 过滤器。 HBase为筛选数据提供了一组过滤器,通过这个过滤器可以在 阅读全文
posted @ 2018-08-29 19:49 流氓小伙子 阅读(376) 评论(0) 推荐(0)
摘要: 转自:https://blog.csdn.net/qq_26803795/article/details/79131678 为了保证效率和质量,每篇文章发布6个知识点,由简单及难,我们继续HDFS: 1)hdfs原理,以及各个模块的职责 Client:切分文件;访问或通过命令行管理HDFS;与Nam 阅读全文
posted @ 2018-08-29 19:47 流氓小伙子 阅读(413) 评论(0) 推荐(0)
摘要: 转自:https://blog.csdn.net/qq_26803795/article/details/79109240 为了保证效率和质量,每篇文章发布6个知识点,由简单及难,我们从HDFS开始: 1)如何杀死一个job hadoop job –list ./hadoop job -kill j 阅读全文
posted @ 2018-08-29 19:45 流氓小伙子 阅读(392) 评论(0) 推荐(0)
摘要: spark工作机制,哪些角色,作用。 spark yarn模式下的cluster模式和client模式有什么区别。 阅读全文
posted @ 2018-08-29 19:29 流氓小伙子 阅读(205) 评论(0) 推荐(0)
摘要: 交换类排序、1、冒泡排序算法冒泡排序在众多排序算法中算比较简单的一个,基本思想是重复的进行整个数列的排序,一次比较两个元素(两两排序),如果它们顺序不符合就交换,重复这样直到数列没有再需要交换的数为止(结束条件)。就好像气泡一样,轻的气泡会往上漂浮,在不断漂... 阅读全文
posted @ 2018-08-28 22:28 流氓小伙子 阅读(229) 评论(0) 推荐(0)
摘要: 1、HDFS副本机制Hadoopde 默认副本布局策略是: (1)在运行客户端的节点上放置第一个副本(如果客户端运行在集群之外,就随机选择一个节点,不过系统会避免选择那些存储太满或者太忙的节点); (2)第二个副本放置在与第一不同且随机另外选择的机架节点上;... 阅读全文
posted @ 2018-08-28 15:15 流氓小伙子 阅读(363) 评论(0) 推荐(0)
摘要: 选择类排序算法1、选择排序算法思想:首先找到数组中最小的那个元素,其次将它和数组中的第一个元素交换(如果第一个元素是最小的,那么和它自己进行交换)。再次,再剩下的元素中找到最小的元素,将它与数组中的第二个元素进行位置交换。如此往复,直到整个数组排序。这就叫选... 阅读全文
posted @ 2018-08-27 22:22 流氓小伙子 阅读(196) 评论(0) 推荐(0)