随笔档案「2020年4月」 - 再见傅里叶

linux sar命令详解

摘要：一、安装一般的命令可以直接使用yum安装，但是sar和mpstat命令这两个命令都是在sysstat包里 sudo yum install sysstat。首次运行sar命令报错：Cannot open /var/log/sa/sa03: No such file or directory 首次阅读全文

posted @ 2020-04-29 14:41 再见傅里叶阅读(920) 评论(0) 推荐(0)

Mysql主从同步原理

摘要：https://blog.csdn.net/qq_41772936/article/details/80380950 阅读全文

posted @ 2020-04-24 18:15 再见傅里叶阅读(114) 评论(0) 推荐(0)

Mysql事务提交与回滚机制

摘要：https://www.cnblogs.com/abin1129/p/11732838.html 阅读全文

posted @ 2020-04-24 18:11 再见傅里叶阅读(440) 评论(0) 推荐(0)

hdfs /tmp目录作用

摘要：HDFS / tmp目录主要用作mapreduce操作期间的临时存储。 Mapreduce工件，中间数据等将保存在该目录下。 mapreduce作业执行完成后，这些文件将自动清除。如果删除此临时文件，则可能会影响当前正在运行的mapreduce作业阅读全文

posted @ 2020-04-24 09:24 再见傅里叶阅读(2274) 评论(0) 推荐(0)

MapReduce中的shuffle

摘要：https://blog.csdn.net/u014374284/article/details/49205885 https://blog.csdn.net/asn_forever/article/details/81233547 https://blog.csdn.net/u014374284/ 阅读全文

posted @ 2020-04-23 17:10 再见傅里叶阅读(865) 评论(0) 推荐(0)

Spark On Yarn 中Executor 内存分配的机制

摘要：https://blog.csdn.net/zhuiqiuuuu/article/details/86539385 ps：这篇文章写得比较好，解答了之前的困惑，需要重点看个人疑惑：实际分配的内存不会算driver-memory的？阅读全文

posted @ 2020-04-22 17:38 再见傅里叶阅读(382) 评论(0) 推荐(0)

ES:倒排索引、分词详解

摘要：https://blog.csdn.net/jiaojiao521765146514/article/details/83750548 ElasticSearch引擎把文档数据写入到倒排索引（Inverted Index）的数据结构中，倒排索引建立的是分词（Term）和文档（Document）之间的阅读全文

posted @ 2020-04-22 17:30 再见傅里叶阅读(365) 评论(0) 推荐(0)

HashMap的扩容机制---resize()

摘要：https://www.cnblogs.com/williamjie/p/9358291.html 那么hashmap什么时候进行扩容呢？当hashmap中的元素个数超过数组大小*loadFactor时，就会进行数组扩容，loadFactor的默认值为0.75，也就是说，默认情况下，数组大小为16，阅读全文

posted @ 2020-04-22 17:13 再见傅里叶阅读(1156) 评论(0) 推荐(0)

ArrayList与LinkedList的区别

摘要：1、数据结构不同 ArrayList是Array(动态数组)的数据结构，LinkedList是Link(链表)的数据结构。 2、效率不同当随机访问List（get和set操作）时，ArrayList比LinkedList的效率更高，因为LinkedList是线性的数据存储方式，所以需要移动指针从前阅读全文

posted @ 2020-04-22 17:10 再见傅里叶阅读(1019) 评论(0) 推荐(0)

HDFS的副本存放策略

摘要：https://www.cnblogs.com/beiyi888/p/9647147.html 首先，HDFS将每一个文件的数据进行分块存储，同时每一个数据块又保存有多个副本，这些数据块副本分布在不同的机器节点上，这种数据分块存储+副本的策略是HDFS保证可靠性和性能的关键，这是因为：一.文件分块存阅读全文

posted @ 2020-04-22 10:06 再见傅里叶阅读(1314) 评论(0) 推荐(0)

Mysql常见面试题2

摘要：https://www.cnblogs.com/williamjie/p/11081592.html 阅读全文

posted @ 2020-04-21 14:47 再见傅里叶阅读(73) 评论(0) 推荐(0)

linux常用命令

摘要：1、jstack(查看线程)、jmap(查看内存)和jstat(性能分析) jstack能得到运行java程序的java stack和native stack的信息。可以轻松得知当前线程的运行情况用法：jstack pid 2、vim命令（文件操作）分为三种模式：命令行模式、编辑模式、末行模式阅读全文

posted @ 2020-04-21 09:53 再见傅里叶阅读(159) 评论(0) 推荐(0)

Hadoop跨集群数据迁移

摘要：https://www.jianshu.com/p/d2068b8247a7 阅读全文

posted @ 2020-04-17 16:59 再见傅里叶阅读(318) 评论(0) 推荐(0)

MapReduce原理

摘要：参考这篇文章，个人觉得讲得比较清晰。https://blog.csdn.net/lhg_198910/article/details/89325499 https://blog.csdn.net/qq_32941881/article/details/81505069 阅读全文

posted @ 2020-04-17 10:55 再见傅里叶阅读(120) 评论(0) 推荐(0)

数仓相关工具

摘要：数据同步工具：离线同步 sqoop /DataX 实时同步 cannal/Flink CDC 权限管理（kerberos,CDH cloudmanager=> sentry ，HDP ambari=>ranger;其中后两者可以做到目录级别用户级别权限管理）数据质量监控工具-Apache Grif 阅读全文

posted @ 2020-04-16 16:06 再见傅里叶阅读(337) 评论(0) 推荐(0)

星型模型和雪花型模型比较

摘要：https://blog.csdn.net/selfsojourner/article/details/80476741 星型模型因为数据的冗余所以很多统计查询不需要做外部的连接，因此一般情况下效率比雪花型模型要高雪花模型使用的是规范化数据，也就是说数据在数据库内部是组织好的，以便消除冗余，因此它阅读全文

posted @ 2020-04-16 11:17 再见傅里叶阅读(1393) 评论(0) 推荐(0)

Hbase介绍

摘要：https://www.cnblogs.com/raphael5200/p/5229164.html 阅读全文

posted @ 2020-04-15 14:56 再见傅里叶阅读(100) 评论(0) 推荐(0)

Oracle备份的几种方式

摘要：https://www.jianshu.com/p/779e8f7cd1a2 阅读全文

posted @ 2020-04-15 13:37 再见傅里叶阅读(211) 评论(0) 推荐(0)

oracle数据库数据导入导出步骤（入门）

摘要：https://www.cnblogs.com/alsodzy/p/8675935.html 阅读全文

posted @ 2020-04-15 13:31 再见傅里叶阅读(150) 评论(0) 推荐(0)

Oracle表空间和数据文件

摘要：https://blog.csdn.net/tpc4289/article/details/79088613 阅读全文

posted @ 2020-04-15 13:28 再见傅里叶阅读(97) 评论(0) 推荐(0)

Mybatis教程

摘要：https://blog.csdn.net/hellozpc/article/details/80878563 阅读全文

posted @ 2020-04-15 10:45 再见傅里叶阅读(78) 评论(0) 推荐(0)

高并发情况下如何保证数据的一致性

摘要：1.业务层面乐观锁CAS，使用版本号解决ABA问题，实际使用中使用时间戳，更新的时候把查出来的时间戳带上，如果更新失败可以自旋，获取最近值和时间戳，直到更新成功。2.DB层面开启一个事务，然后select一行for update给这一行加上排它锁，再去更新行，然后提交，其他事务就会阻塞在select 阅读全文

posted @ 2020-04-13 10:47 再见傅里叶阅读(3446) 评论(0) 推荐(0)

分布式事务概述

摘要：https://www.jianshu.com/p/ec19558ff255 阅读全文

posted @ 2020-04-13 09:22 再见傅里叶阅读(130) 评论(0) 推荐(0)

Flink中并行度与slot

摘要：https://my.oschina.net/u/3892023/blog/3007172 阅读全文

posted @ 2020-04-10 15:23 再见傅里叶阅读(870) 评论(0) 推荐(0)

Spring IOC AOP

摘要：https://blog.csdn.net/dkbnull/article/details/87219562 阅读全文

posted @ 2020-04-10 13:35 再见傅里叶阅读(104) 评论(0) 推荐(0)

DES、AES、RSA等常用加密算法介绍与比较

摘要：https://blog.csdn.net/w4hechuan2009/article/details/76601895 加密算法分对称加密和非对称算法，其中对称加密算法的加密与解密密钥相同，非对称加密算法的加密密钥与解密密钥不同，此外，还有一类不需要密钥的散列算法。常见的对称加密算法主要有DES 阅读全文

posted @ 2020-04-09 16:18 再见傅里叶阅读(975) 评论(0) 推荐(0)

linux操作系统的分类及解释

摘要：https://www.jianshu.com/p/7c63f3a1de7d 阅读全文

posted @ 2020-04-09 14:01 再见傅里叶阅读(379) 评论(0) 推荐(0)

Flink WaterMark机制与Allowed Lateness机制详细介绍

摘要：个人理解：watermark是全局机制针对所有的key,如果要解决同一个key的乱序迟到问题就需要用到Allowed Lateness机制。因为一般都是按照某个key分组，需要的也是解决同一个key的乱序迟到问题。 https://blog.csdn.net/yangxiaobo118/artic 阅读全文

posted @ 2020-04-09 09:17 再见傅里叶阅读(877) 评论(0) 推荐(0)

HashMap

摘要：https://www.jianshu.com/p/ee0de4c99f87 阅读全文

posted @ 2020-04-08 14:58 再见傅里叶阅读(124) 评论(0) 推荐(0)

hive中order by ，sort by ，distribute by 和 cluster by

摘要：总说：笼统地看，这四个在hive中都有排序和聚集的作用，然而，它们在执行时所启动的MR却各不相同。细讲：order by： order by会对所给的全部数据进行全局排序，并且只会“叫醒”一个reducer干活。它就像一个糊涂蛋一样，不管来多少数据，都只启动一个reducer来处理。因此，数据量小阅读全文

posted @ 2020-04-07 13:48 再见傅里叶阅读(674) 评论(0) 推荐(0)

spark广播变量与累加器

摘要：理论知识介绍:(个人理解使用广播变量是优化项之一) https://blog.csdn.net/Android_xue/article/details/79780463/ 一、为什么要使用共享变量 Spark中因为算子中的真正逻辑是发送到Executor中去运行的，所以当Executor中需要引用外阅读全文

posted @ 2020-04-07 09:12 再见傅里叶阅读(179) 评论(0) 推荐(0)

ORM（Object Relational Mapping）框架

摘要：https://www.jianshu.com/p/313cd335720f 阅读全文

posted @ 2020-04-02 14:35 再见傅里叶阅读(124) 评论(0) 推荐(0)

BIO、NIO和AIO的区别、三种IO的原理与用法

摘要：https://blog.csdn.net/u010541670/article/details/91890649?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-t 阅读全文

posted @ 2020-04-02 13:23 再见傅里叶阅读(713) 评论(0) 推荐(0)

Java的AQS(抽象队列同步器)

摘要：https://www.jianshu.com/p/0f876ead2846 阅读全文

posted @ 2020-04-02 13:17 再见傅里叶阅读(155) 评论(0) 推荐(0)

Hbase常见面试题

摘要：1、Hbase架构与数据存储 2、Hbase读写原理 3、Hbase 热点问题读写热点解决办法： region预分区、rowkey前缀做MD5散列设计 4、Hbase调优 Scan 缓存如果HBase的输入源是一个MapReduce Job，要确保输入的Scan的setCaching值要比默认值阅读全文

posted @ 2020-04-02 09:30 再见傅里叶阅读(504) 评论(0) 推荐(0)

Scala隐式转换与隐式参数详解

摘要：https://blog.csdn.net/qq_37142346/article/details/81064721 阅读全文

posted @ 2020-04-01 09:14 再见傅里叶阅读(137) 评论(0) 推荐(0)

再见傅里叶

04 2020 档案

公告