上一页 1 ··· 9 10 11 12 13 14 15 下一页
摘要: 在Spark中,RDD(弹性分布式数据集)存在依赖关系,宽依赖和窄依赖。 宽依赖和窄依赖的区别是RDD之间是否存在shuffle操作。 窄依赖 窄依赖指父RDD的每一个分区最多被一个子RDD的分区所用,即一个父RDD对应一个子RDD或多个父RDD对应一个子RDD map,filter,union属于 阅读全文
posted @ 2020-02-28 11:23 Tanglement 阅读(1471) 评论(0) 推荐(0)
摘要: 实现一个atoi函数,使其能将字符串转成整数,根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或负号时,则将该符号与后面尽可能多的连续数字组合起来,作为该整数的正负号。之后可能有多余字符,可以被忽略。不能有效转换,返回0. 题解 没有什么优解,只能根 阅读全文
posted @ 2020-02-27 21:47 Tanglement 阅读(125) 评论(0) 推荐(0)
摘要: 简介和安装 HBase来源 列式数据库的优势 HBase的意义 HBase的安装、配置文件 客户端API:基础知识 基础操作Put Get Delete Scan Scan与Get的区别,一批记录和一条记录 Result类和ResultScanner类 行锁 较少RPC 远程程序调用,减少网络开销 阅读全文
posted @ 2020-02-23 11:32 Tanglement 阅读(144) 评论(0) 推荐(0)
摘要: Map public static class MyMapper extends Mapper 继承Mapper类 其中的含义如下: LongWritable为map函数的输入键,行首偏移量 Text为map函数的输入值,每行的内容 Text为输出类型,根据业务来定义 IntWritable为输出值 阅读全文
posted @ 2020-02-22 15:26 Tanglement 阅读(120) 评论(0) 推荐(0)
摘要: 引自[https://blog.csdn.net/weixin_43192721/article/details/88420401] 1. 删除效果不一样 内部表:删除元数据和文件 外部表:删除元数据,不删除文件 所以ETL时,用内部表作为中间结果好一点 2. 内部表由hive管理,外部表由hdfs 阅读全文
posted @ 2020-02-21 14:42 Tanglement 阅读(214) 评论(0) 推荐(0)
摘要: 引自[https://www.iteye.com/blog/langyu 992916] shuffle的意义有三点: 1.把map task端的数据完整传输到reduce task端 2.减少不必要的宽带消耗 3.减少磁盘IO消耗 首先把Shuffle理解为map的shuffle和reduce的s 阅读全文
posted @ 2020-02-20 12:11 Tanglement 阅读(442) 评论(0) 推荐(0)
摘要: 给出一个32位的有符号整数,你需要将这个整数中每位上的数字进行反转。 题解 简单题。每次把数x的个位数分离出来,用新的数y加起来。有堆栈的思想。 题目的难点在于不能溢出一个范围 所以解题过程中,需要有判断条件 我的解法代码 阅读全文
posted @ 2020-02-14 15:03 Tanglement 阅读(93) 评论(0) 推荐(0)
摘要: 将一个给定字符串根据给定的行数,以从上往下、从左到右进行Z字形排列。 比如输入字符串"LEETCODEISHIRING"行数为3时,排列如下: 之后,你的输出需要从左往右逐行读取,产生一个新的字符串,比如"LCIRETOESIIGEDHN" 题解 这个思想很奇妙,时间复杂度和空间复杂度都是O(n), 阅读全文
posted @ 2020-02-12 13:58 Tanglement 阅读(100) 评论(0) 推荐(0)
摘要: 给定一个字符串s,找到s中最长的回文子串。你可以假设s的最大长度为1000. 这题是很经典的题目,找到最长回文子串,回文就是bab,cabac这样的。 题解 解法一 暴力法,列举所有的子串,判断是否为回文串,很明显时间复杂度为O(n^2)。 解法二 将原字符串s倒置s',然后寻找最长回文串就变成寻找 阅读全文
posted @ 2020-02-11 15:46 Tanglement 阅读(155) 评论(2) 推荐(0)
摘要: 给定两个大小为m和n的有序数组nums1和nums2。请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为O(log(m+n))。 你可以假设nums1和nums2不会同时为空。 题解 解法一 暴力法,即从头到尾找到合并数组的中位数。时间复杂度O(m+n) 解法二 看到log,要自然想到二分法 阅读全文
posted @ 2020-02-10 16:50 Tanglement 阅读(148) 评论(0) 推荐(0)
上一页 1 ··· 9 10 11 12 13 14 15 下一页