面试

Redis-项目

更新策略

内存淘汰：什么也不用管让redis自己维护超出一定空间就会删除缓存然后下次查询时更新缓存
超时剔除：给KEY加上TTL过期时长到期后redis就会删除
主动更新：自己编写业务逻辑在修改数据库时更新缓存
主动更新一般采用先写数据库再删除缓存
最佳实践就是采用主动更新策略然后用超时剔除兜底

缓存问题

缓存穿透
就是请求的数据在缓存中和数据库中不存在请求会直接打到数据库上如果请求量过大就会对数据库造成较大压力
解决策略

返回空值最简单但是会占用过多内存存在数据不一致问题
布隆过滤实现起来麻烦而且会存在误判的可能性
增加ID复杂度避免ID被猜测
做好参数限流
做好响应权限和基础校验格式

缓存雪崩
就是大量缓存KEY失效或者redis服务宕机造成请求都打到数据库压力过大
解决策略

对key有效时长增加随机TTL
做好redis集群服务
做好服务降级策略如果大量请求打过来先快速响应失败一部分请求减缓压力
给服务添加多级缓存

缓存击穿
就是热点KEY问题某些高并发且重建服务比较复杂的KEY失效导致压力过大
解决策略

互斥锁 setnx命令来实现
逻辑过期

互斥锁就是查询如果失效会获取互斥锁然后开始重建热点key 在这期间其他试图获取互斥锁就会失效
逻辑过期就是不设置TTL 用逻辑时间来表示是否过期如果过期需要重建服务也获取互斥锁然后新开一个线程进行重建热点key 然后直接返回过期数据在重建热点key期间如果有其他线程进来也会获取互斥锁失败然后直接返回过期数据这就是跟互斥锁来重建不同的
第一种方法重建过程中其他线程来访问需要等待如果时间过长就会造成阻塞实现简单可以保证一致性但是性能较低甚至可能有死锁风险
第二种直接用过期数据来返回更快性能更好但是无法保证一致性问题还会有额外的内存消耗

超卖问题

多线程引发超卖导致库存为负数解决超卖问题就需要加锁
一般用乐观锁解决超卖问题分为两种

版本号法给数据库设置一个新的属性版本号然后查询的时候查库存和版本号进行修改的时候使version + 1并加上where条件除了where id = ？之外加一个version = ？
CAS法就是对版本号进行更新
比如库存stock 直接就是where条件判断stock等不等于查询的时候即可也可以更加快捷一下直接判断stock>0即可这样只需要保证stock大于0 直接扣减库存肯定不会出问题

分布式锁

分布式锁在redis中实现是setnx实现 然后由于还需要设置超时时间所以汇聚到一条命令里set key value nx ex 10 成功返回true 失败返回false 但是由于stringRedisTemplate是用的Boolean封装而普通的是boolean 所以需要拆箱拆箱过程中就有可能因业务阻塞引起误删锁问题
因此为了解决误删问题引入了lua脚本
但是同样用纯redis实现分布式锁还是会有问题

不可重入锁只能获取一次如果同一个线程获取多个锁就不行
不可重试只能获取一次获取失败直接返回结果
主从一致问题
超时释放如果业务执行时间较长有可能会释放锁导致安全问题

因此引入Redisson

分布式锁-Redisson

Redisson解决了由纯redis引入分布式锁的问题

可重入性底层采用哈希结构来记录当前线程获取锁的次数每次锁多获取一次就重置TTL 然后释放的时候判断锁次数是不是0 如果是0 就释放如果不是0 就-1 然后重置TTL
可重试 Redisson利用订阅发布功能获取失败并不会返回失败而是会等待等其他线程释放锁之后发布释放信号然后订阅锁开始获取达到重试功能
主从一致性 Redisson解决该问题用了联锁所有的节点都会获取一遍锁只有当所有节点都获取之后才算获取锁成功
超时释放 Redisson采用看门狗机制来进行续约每隔一段时间都会重置超时时间

Redis消息队列

Redis消息队列分三种实现方式

List 该方式支持持久化但是不支持消息确认和消息回溯
PubSub 不支持持久化以及消息确认和消息回溯
Stream 支持持久化消息确认和消息回溯

Stream实现的消息队列获取消息后会先存入Steam中然后等待消费者获取确认如果消费者获取了没有确认那么这个消息就会存入一个pending-list中然后从这个list中取消息处理处理完成之后会发送XACK来确认消息被消费

秒杀业务优化

主线程通过lua脚本核算资格并检验是否重复下单后并发送到消息队列然后直接创建订单返回然后通过后置处理器在容器创建之初就通过线程池异步开启线程来从steam消息队列中获取消息然后执行创建订单确认消费如果没有消费就从pending-list获取未被消费的消息继续执行并通过Redisson获取分布式锁锁保证一人一单然后创建订单并用数据库CAS来预防超卖问题由于存在自调用防止切面导致事务失效所以在主线程中获取了代理对象然后在子线程处理创建订单通过代理对象处理使事务成功

Redis-原理

数据结构

字符串SDS

获取字符串时间复杂度O(1)
支持动态扩容
二进制安全因为记录了总字节数所以遍历直接根据总字节数遍历即可不用管有没有'0'
减少内存分配直接动态扩容即可不用再申请另外的内存空间

IntSet

IntSet基于数组实现有长度可变有序的特征采用统一的编码方式便于根据字节数快速查找如果存储数据超过当前编码方式大小之后就会自动进行编码升级

确定所超过的数据最适合的编码方式
然后将原数组倒序扩容到正确位置
插入新数据
更改头中的编码方式

有序底层是基于二分查找来实现的在二分查找过程中如果找到相同数据会直接返回原数组来确保数据唯一

IntSet中数据唯一
具有编码方式升级的功能节省内存空间
底层采用二分法查找实现

Dict

Dict是数组结合指针实现就是先创建Dict头然后确定size总大小并且还会创建两个DictHashTable 一个是存储数据另一个就是做rehash会用到然后会根据key算出hash值再让求到的hash值跟sizemask与运算得到所在数组的具体位置这个数组就会指向每一个Dict

在Dict中有一个负载因子（used/size) 当负载因子超过1且没有执行bgsave或超过5会扩容每次删除key检查负载因子小于0.1就会收缩无论收缩还是扩容由hash值计算的索引都会失效所以都会进行rehash 然后由于rehash要进行大量读写所以一般是渐进性rehash
rehash流程

先计算新的size 根据used来算
然后根据size申请新的空间
每次增删改查就判断rehashidx 如果大于1 就把dict[0]下的一个索引下的数据都rehash到dict[1] 直到所有索引全部rehash完成
然后把dict[1]给到dict[0] 原来的dict[0]释放
把rehashidx = -1 代表rehash结束

ZipList

可以看成时一种特殊的双端链表只不过没有指针是由一段连续的内存空间实现会动态分配内存且两端压入/弹出都是O(1) 每一个entry中会记录前一个和自身的占用字节然后来实现计算

连续空间的双端链表
没有指针靠记录上一个和自身的字节数来寻址内存占用低
数据量过大会导致链表过长影响查询性能
删除较多较大数据会出现连锁更新问题

QuickList

解决ZipList的问题引入了QucikList QuickList是一个双端链表不过每一个节点都是ZipList

节点为ZipList的双端链表
节点ZipList解决了传统链表资源占用问题
解决了因ZipList过大而申请效率的问题
中间节点可以进一步压缩更节省空间

SkipList

跳表是双端链表并且包含多个指针每个指针跨度不同而且是升序排列

是一个双端链表每个节点都有score和ele score来排序 score一样就按ele排序数据在ele中存储
不同的指针层级最大为32层越大跨度越高
查询效率和红黑树一致但是实现简单

RedisObject

String
String底层用SDS实现如果是小于LONG_MAX的整数会取消SDS 直接存储在ptr指针里
List
采用QuickList实现
Set
由于元素唯一无序因此使用Dict实现 value为空只在key中存入数据不过如果Set中都是整数且元素不超过默认最大数量时会采用IntSet实现
ZSet
元素有序唯一并且还要根据key找value 所以底层使用Dict和SkipList实现 SkipList确保有序Dict确保唯一但是占用内存很大所以当数据量过小时会采用ZipList实现手动维护排序逻辑
Hash
默认采用ZipList实现两个Entry一个是key一个是value 如果数据量过大就会采用Dict实现

IO模型

影响读写的最大因素就是等待内核响应和把数据写到缓冲区所以就会产生多种IO模型
阻塞IO
发送recvform命令然后阻塞等待内核响应相应之后开始拷贝拷贝过程中也是阻塞等待

非阻塞IO
也是发送recvform命令但是内核会直接返回结果如果没有数据就返回异常信息然后用户会反复发起请求直到有结果响应为止响应之后拷贝数据同样是阻塞的虽然第一阶段是非阻塞的但是由于一直在发请求造成CPU忙等导致CPU使用率提高

IO多路复用

IO多路复用会发送select命令来监听FD（文件描述符）包含socket 然后监听多个FD 如果内核态数据准备就绪会返回响应告知用户态此时用户态发送recvform命令来拷贝数据虽然第二阶段仍然是阻塞拷贝第一阶段虽然也是等待但是由于监听多个FD 只要有一个准备好了就可以开始准备数据因此是一种有效等待
实现监听FD的方式常见有三种 select poll和epoll
select和poll这两种监听FD 当FD准备就绪之后会把所有的FD全部拷贝到用户空间让用户去遍历获得已就绪的FD 然后遍历完再把整个FD拷贝给内核态
而epoll会建立一个红黑树来添加FD 并且每个FD都有一个回调函数如果FD就绪就会把已就绪的FD放到就绪数组中然后直接把数组中已就绪的FD拷贝到用户空间即可
epoll时间通知方式分为LT和ET 默认是LT 就是重复通知多次直到数据处理完 ET就是只通知一次不管处理没处理完
LT会导致惊群问题只需要两个线程但是由于一直在通知导致所有的线程都被唤醒最佳实践是ET只通知一次然后采取非阻塞IO一直读直到读完

Redis网络模型
Redis网络模型就是采取基于epoll实现的IO多路复用先创建epoll实例监听不同的FD也就是socket 然后监听到就绪之后做事件派发把socket派发给不同的处理器分为连接应答处理器命令请求处理其命令回复处理器在Redis6.0之后命令回复处理器改为了多线程然后命令请求解析也变成了多线程但是核心的命令执行还是单线程

内存回收策略

分为惰性删除和周期删除

惰性删除
key过期后不会立即删除而是会等到下一次访问这个key时检查这个key的过期时间如果过期了再删除
问题就是如果有的key频率很低过期了一直不会删除
周期删除
分为两种模式 FAST和SLOW SLOW模式默认频率时10hz 每次耗时不超过25ms FAST模式两次间隔不能低于2ms 耗时不能超过1ms

一般都是二者结合组成内存回收策略

内存淘汰策略

其实就是分为两大类四种一类是对有TTL的操作一类是对全体的key操作四种分别是一个随机KEY 一个算出最小TTL 一个是LRU 一个LFU 默认是不淘汰任何key

Redis持久化

分为RDB和AOF两种
RDB
是Redis数据备份文件也叫数据快照即使把Redis中的所有数据备份到磁盘然后Redis如果故障就可以通过读取磁盘的文件达成快速数据恢复
RDB一般是通过bgsave命令来开启一个子线程去备份数据子线程会复制一个页表根据页表的映射关系向磁盘中存储数据快照
AOF
是追加文件 Redis每一个命令都会记录下来命令日志文件可以通过配置开启并设置记录频率一般是一秒记录一次最多丢失一秒数据还可以通过bgrewriteof来对命令进行重写就是以最少的命令来完成数据的记录
一般项目中都是二者结合使用

Redis集群服务

主从集群

主从集群提高Redis的并发读分为一个主节点多个从节点主节点可读可写从节点只能读
同步原理
分为全量同步和增量同步区别就是判断节点的replId是否一致如果不一致代表是第一次连接就执行bgsave命令把生成的RDB文件发给从节点让从节点的replId和所有的数据一样如果判断replId一致代表从节点是断网重连因此需要做增量同步在主节点中有一个循环数组repl_backlog 主节点的offset减去从节点的offset 多出来的就是需要做增量同步的一部分把这些缺少的发给从节点即可完成增量同步之后主节点每次写数据都会传给从节点实现实时同步

哨兵集群

通过哨兵集群来检测主从集群的服务状态分为三个作用

监控哨兵会定时通过心跳检测主从集群的每个节点服务状态
自动故障切换如果其中一个哨兵发现主节点故障会认为该主节点主观下线如果超出半数以上的哨兵都认为主节点故障就是客观下线就会在从节点中选出一个作为主节点一般规则就是看从节点的offset哪个最大
通知当更换主节点时哨兵会把更换的主节点信息推送给redis客户端也会告诉其他从节点新的主节点信息如果之前主节点恢复也会变为从节点

哨兵脑裂问题
是由于网络原因导致哨兵检测不到主节点因此会在从节点选举出新的主节点但是主节点并没有故障还是跟客户端连接不停读写数据因此造成多个主节点并且数据不同步网路恢复后会将之前的主节点变成从节点然后进行数据同步导致丢失数据就是脑裂现象解决该问题就是可以通过修改配置来解决比如至少有一个从节点才能同步数据第二个可以设置数据复制和同步的延迟时间减少数据丢失

分片集群

主从哨兵解决了高并发读和高可用的问题但是还存在高并发写和大量存储的问题就是分片集群
分片集群分为多个主节点每个主节点可以有多个从节点然后每个主节点间会通过心跳检测省去了哨兵然后通过散列插槽来进行分片集群的存储问题会根据key做hash运算然后对16384取余得出结果就是在分片集群中的位置这样保证可以根据key拿到信息解决高并发写以及大量存储数据的问题

Mysql

慢查询

如何定位慢查询

慢查询表象就是查询时间过长接口压测响应时间超过1s
开源工具
Skywalking来定位慢查询
Mysql自带慢日志
通过在Mysql中开启慢日志查询开关然后配置最大时长如果sql语句超过该时长就会记录到log日志文件中

分析sql

在查询语句之前加上explain或者desc 就能得到sql查询语句的信息

key：命中的索引 key_len：索引大小
通过key和key_len来查看是否命中索引 Extra是优化建议看看sql需不需要做回表 type是sql连接类型性能由好到坏分为NULL system const eq_ref ref range index all
const：主键查询
eq_ref：主键索引查询或唯一索引查询
ref：索引查询
range：范围查询
index：索引树扫描
all：全盘扫描

sql执行很慢如何分析
采用mysql自带的分析工具EXPLAIN
根据key和key_len查看是否命中了索引
根据type类型分析是否需要进一步优化是否存在全盘扫描或索引树
根据extra判断是否出现了回表如果是就添加索引或修改返回字段

索引

什么是索引

索引就是帮助mysql高效获取数据的有序数据结构在数据之外数据库系统维护者满足特定算法的数据结构（B+树）这些数据结构以某种方式指向数据就可以在mysql中实现高级查找算法这种数据结构就是索引

索引的底层数据结构

mysql底层使用的是B+树其他的二叉搜索树存在最坏情况红黑树也是二叉树如果数据量很大层级就会很高同样查找会慢

B树 B树是多叉路平衡查找树 balance 有多个分支每个数据之间通过指针指向下一层级的数据下面就是5阶的B树存四个数据五个指针

B+树是对B树的优化只有叶子节点有数据其他节点都是指针存储 mysql中的存储引擎InnoDB就是用B+树实现的索引结构

优势
由于其他节点不带数据遍历的时候不会把额外数据查上所以磁盘读写代价B+树更低
查询效率B+树更稳定
B+树叶子节点通过双端链表连接更便于做扫库和区间查询

什么是索引
索引是帮助mysql高效查找数据的一种有序数据结构
索引能够提高检索效率不需要全盘扫描降低数据库IO成本
通过索引对数据排序降低排序成本减少CPU损耗
索引底层的数据结构
Mysql的InnoDB引擎采用的是B+树的数据结构来存储索引
阶数更短层级更少
磁盘读写代价B+树更低非叶子节点只存储指针叶子节点存储数据
叶子节点用双端链表连接便于扫库和区间查询

聚簇索引非聚簇索引回表查询

聚簇索引
只有一个以主键创建索引保存的数据是整行的数据
非聚簇索引也叫二级索引
可以有多个保存的数据是当前行的主键如果没有主键就会用唯一索引如果没有唯一索引 InnoDB就会创建一个rowID

回表查询
比如查询语句select * from user where name = 'Arm' 因为name创建了索引所以会先走二级索引找到name对应的数据是主键然后回去再根据主键走聚簇索引拿到主键对应的整行数据就完成了查询

什么是聚簇索引什么是非聚簇索引
聚簇索引只有一个就是把数据和索引放在一块 B+树的叶子节点保存了整行的信息一般都是主键
非聚簇索引可以有多个数据和索引分开存储 B+树叶子节点保存了主键无主键保存唯一索引无唯一索引保存rowID
什么是回表查询
就是通过二级查询拿到对应的主键然后再根据主键走聚簇索引拿到整行的数据

覆盖索引超大分页优化

覆盖索引
查询用到了索引然后返回的信息在索引的查询中能够全部得到
简而言之就是不涉及回表查询的索引查询就是覆盖索引

什么是覆盖索引
覆盖索引就是查询用到了索引并且返回的列中能够在索引查询中一次性全部得到
超大分页怎么处理
mysql数据量过大时分页深度越深 limit做分页查询需要对数据进行排序耗时过长
解决思路是覆盖索引加子查询就是通过id查询也就是根据覆盖索引把数据分页排好序然后去跟原来表进行关联查询就可以提升性能
索引创建原则有哪些
单表数据量大且查询比较频繁的表
常作为查询排序分页的字段需要创建索引
尽量联合索引避免回表查询
控制索引数量越多维护成本越大
字段内容区分度高
内容长使用前缀索引
索引不能使用null值用not null约束

索引失效

违反最左前缀法则
如果索引了多列就是联合索引好几个字段使用索引查询需要从最左前列开始才会命中索引如果跳过索引后续就会失效不命中
也就是需要按照顺序来用索引否则就会失效
范围查询右边的列
如果查询的时候在中间的索引用来范围查询那么该索引右边的列就都不会命中
索引列上进行运算操作 索引失效
字符串不加单引号 mysql会进行类型转换从而导致索引失效
以%开头的like模糊查询 索引失效如果%放在末尾正常命中

什么情况下索引会失效
使用联合索引时违反了最左前缀法则
范围查询时右边的列索引会失效
索引的列不能进行运算
以%开头的模糊查询索引会失效
字符串不加单引号 mysql会进行类型转换索引会失效

sql优化

表的设计优化
参考了阿里的开发手册
设计合适的数值 int bigint 根据实际情况选择
设计合适的字符串类型 char和varchar char定长效率高 varchar可变效率低
sql语句优化
select指明字段名称避免直接用* 预防回表查询
sql语句避免索引失效的情况
用union all代替union union会多一次过滤的操作效率低
避免在where字句中对字段进行表达式操作
join优化能用innerjoin就不用left join right join 因为内连接会对两个表进行优化以小表为驱动
主从复制读写分离
如果有大量操作都是读为了避免写操作影响读操作的情况就可以搭建主从复制来进行读写分离

对sql优化的经验
表的设计优化
索引优化索引创建原则
sql优化
主从复制读写分离
分库分表

事务

事务特性

原子性（Atomicity）要么都成功要么都失败
隔离性（Consistency）不能被其他事务干扰
一致性（Isolation）数据要一致
持久性（Durability）进行落盘操作就是持久化
转账案例结合说明

并发事务问题隔离级别

并发事务问题
脏读：一个事务读到了另一个事务还没提交的数据

不可重复读：一个事务先后读取同一条记录读取的数据不同
幻读：在解决了不可重复读的问题上一个事务先查询数据发现没有数据插入数据时发现数据已经存在再查询还是查询不到就是幻读其实是另一个事务插入了数据

隔离级别
未提交读不能解决任何问题
读已提交可以解决脏读但是不能解决后两种
可重复读解决了脏读不可重复度 mysql默认使用无法解决幻读
串行化解决所有但是不推荐因为一个事务必须提交才能让另一个事务访问并发效率不好

redo log和undo log

mysql中有两个结构
缓冲池：内存中的一个区域存放着磁盘中经常操作的数据可以减少磁盘IO
数据页：InnoDB引擎中管理的最小单元存放着数据默认一页16kb
mysql操作时会先操作缓冲池如果缓冲池中没有数据就加载磁盘并缓冲到内存的缓冲池中然后操作完再从内存刷新到磁盘中但是如果还没刷新 mysql宕机了就会破坏持久化就要用到redo log
redo log
重做日志用来记录事务提交时数据页的修改来实现事务的持久性
日志文件由两部分组成重做日志缓冲（redo log buffer）和重做日志文件（redo log file）前者存在内存后者存在磁盘当事务提交之后会把数据同步到该日志文件中如果发生错误导致数据丢失就根据文件来恢复数据

undo log
回滚日志用来记录数据被修改前的信息作用包含回滚和MVCC redo log是物理日志 undo log是逻辑日志
比如如果删除一条信息 undo log就记录新增一条信息
如果更新一条信息 undo log就记录更新之前的信息
undo log 可以用来确保事务的一致性和原子性

undo log 和redo log 的区别
redo log记录的数据页的物理变化服务宕机是可以用来同步数据
undo log记录的是逻辑日志事务回滚时可以逆操作来恢复数据
redo log保证了事务的持久性 undo log 保证了事务的原子性和一致性

MVCC

事务的隔离性如何实现
通过排他锁和MVCC
排他锁：一个事务获取了数据行的排他锁其他事务就不能再获取改行的其他锁
MVCC：多版本并发控制
MVCC
Multi-Version-Concurrency-Control 多版本并发控制维护一个数据的多个版本使读写操作没有冲突
MVCC的具体实现依赖数据库的隐式字段 undo log日志 readView

隐藏字段

DB_TRX_ID：最近修改事务ID 记录插入这条记录或最后一次修改这条记录的事务ID
DB_ROLL_PTR：回滚指针指向这条记录的上一个版本配合undo log 指向上一个版本
DB_ROW_ID：隐藏主键如果没有主键会生成该隐藏主键
undo log
回滚日志在insert update delete产生便于数据回滚的日志
如果是insert 只在回滚时需要事务提交之后就会删除
如果是update delete不只回滚需要 MVCC版本访问也需要不会立即删除
undo log版本链

不同事务操作数据时会生成一条记录版本链表头部是最新的旧数据尾部是最早的旧数据
readView
当前读
读取数据的最新版本读取时保证其他并发事务不能修改读取时会加锁只要提交就会读到最新数据
快照读
简单的select 不加锁读取的有可能是历史版本非阻塞读根据隔离级别不一样读到的数据也不一样
Read Committed 每一个select都会生成一个快照
Repeatable Read 开启事务后的第一个select才会生成快照
ReadView包含四个核心字段

主要就是看事务ID和活跃的事务ID比对比如在事务5第一次查询的时候事务二的数据就可以被访问因为事务2的ID小于活跃事务ID的最小值
不同的隔离级别生成ReadView的时机不同
Read Committed 每一次快照读都生成ReadView
Repeatable Read 仅事务中第一次快照读生成ReadView 后续都复用该ReadView

事务的隔离性如何实现的？
通过锁和MVCC来实现
其中MVCC是多版本并发控制指维护一个数据的多个版本使读写操作没有冲突底层由三个部分来实现

隐藏字段
trx_id 当前事务ID 记录每一次操作的事务ID 自增
roll_pointer 回滚指针指向上一个版本的事务地址
undo log
回滚日志：存储老版本数据
版本链：多个事务并行操作某一行数据记录该数据的历史版本通过roll_pointer形成一个链表
ReadView
解决事务查询选择的版本问题
根据ReadView匹配规则和一些事务ID来判断可以访问哪个版本的数据
不同隔离级别的快照读是不一样的最终访问结果也不一样
Read Committed 每一次执行快照读都会生成ReadView
Repeatable Read 仅在事务第一次执行快照读生成ReadView 后续复用

主从同步原理

Mysql主从复制同步的核心就是二进制日志
二进制日志（BINLOG）记录了所有的DDL（数据定义语言 create drop）语句和DML（数据操纵语言如insert update）语句不包括数据查询语句

就是主库在事务提交时会把数据变更记录在二进制文件（BINLOG）中
从库读取主库的二进制文件写到从库的中继文件（Relay log）中
从库根据中继文件来实现数据同步

分库分表

当数据量过大时就需要用到分库分表可以分担访问压力解决存储压力
拆分策略分为垂直拆分水平拆分垂直拆分然后两种都分为分库和分表
垂直分库

根据业务不同将不同表拆分到不同数据库中
在高并发下可以提高磁盘IO和数据量连接数
垂直分表

实现数据冷热分离
减少IO过渡争抢两表互不影响
水平分库

水平分库由于多个库加起来才是完整的数据所以需要做路由
路由规则分为根据ID取模和按范围路由
特点就是解决了单库大数量高并发的性能问题
提高系统的稳定性和可用性
水平分表
水平分表和水平分库差不多水平分做路由
特点就是优化单一表数据量过大产生的性能问题
避免因IO争抢而导致的锁表问题

分库之后的问题
分布式事务
跨节点关联查询
跨节点分页做排序
主键避重

解决思路就是加一个中间件比如mycat

你们项目使用过分库分表吗

业务介绍
根据简历上的项目来介绍
达到什么样的量级
拆分策略
水平分库把一个库的数据拆成多个库解决了高并发以及海量数据存储问题要用到mycat解决路由
水平分表解决了单表存储和性能问题用到mycat解决路由
垂直分库根据业务拆分高并发下提高磁盘IO和网络连接数
垂直分表冷热数据分离多表互不影响

框架

Spring

单例Bean是线程安全的吗
不是线程安全的 Spring框架中有个@Scope注解默认是单例Singleton 因为一般在注入的时候注入的都是无状态的对象是线程安全的如果在注入的对象定义了修改的变量就不是线程安全的可以用多例模式或者加锁来解决

AOP

AOP称为面向切面编程用于将那些与业务无太大关系且公共性又高的行为和逻辑抽取并封装为一个公共模块这个模块称为切面（Aspect）减少代码耦合便于维护
常见使用场景：记录操作日志缓存处理 Spring内置的事务处理
案例就是通过自定义注解填充公共字段
什么是AOP
面向切面编程用于将那些与业务无关但是公共性又比较高的行为和逻辑抽取为一个公共模块可以降低代码耦合度提高系统可维护性
使用AOP
记录操作日志缓存 Spring内置的事务处理案例：填充公共字段
通过环绕通知+切点表达式根据连接点JointPoint通过反射拿到对应的信息类方法各种参数然后来完成一系列逻辑
Spring中的事务是如何实现的
就是定义了Transactional注解然后切点就是这个注解通过环绕通知来控制事务的开启提交回滚

事务失效的场景

异常捕获处理
就是发生异常然后自己通过try catch捕获了异常事务就会失效解决思路就是再把异常抛出去让Spring感知到就可以了
抛出检查异常
Spring默认的事务回滚是发生检查异常才会回滚非检查异常不会解决思路就是配置rollbackfor属性@Transactional(rollbackfor = Exception.class)这样只要是异常就会发生正常回滚
非Public方法
Spring创建代理做事务通知前提条件都是public方法如果不是public就会导致事务失效
自调用

Bean的生命周期

Bean的生命周期
首先通过BeanDefinition来获取Bean的定义信息然后调用构造函数实例化Bean 再走Bean的依赖注入包括Autowired 然后处理Aware接口去进一步修改Bean的属性接着调用初始化之气那的后置处理器然后开始初始化一个通过spring自带的afterPropertiesSet来设置属性还可以通过@postConstruct来自定以init初始化方法然后初始化完成会调用初始化之后后置处理器来完成对Bean的进一步增强常见的就是AOP 通过动态代理基于反射来进一步增强Bean的行为到这里Bean就创建完成可以使用了后续容器关闭会调用销毁方法来销毁Bean 如果加了@preDestroy会在销毁之前进行一系列行为

Spring循环依赖

Spring解决循环依赖是通过三级缓存来解决
一级缓存 singletonObjects 单例池缓存已经走完完整生命周期初始化完成的Bean
二级缓存 earlySingletonObject 早期单例池缓存生命周期没走完的Bean对象
三级缓存 singletonFactories 缓存的是对象工厂用来创建对象的

二级缓存可以解决一部分循环引用问题但是如果对象A是由代理对象来代理就无法解决所以需要三级缓存来解决代理对象产生的循环引用

三级缓存就可以解决大部分循环依赖问题了不能解决的比如由构造方法造成的循环依赖解决思路就是通过@Lazy懒加载来解决循环依赖

Spring的循环依赖
循环依赖就是两个以上的Bean相互引用对方造成的现象比如A依赖B B依赖A
Spring允许循环依赖的存在由三级缓存来解决循环依赖
一级缓存是 singletonObject 单例池存储的都是走完完整生命周期的Bean
二级缓存是 earlySingletonObject 早期单例池也叫半成品区存储的未走完生命周期的Bean
三级缓存是 ObjectFactory 对象工厂来创建某个对象的
要来创建A 先实例化A 然后A生成了一个对象工厂的对象放在三级缓存中然后需要注入B B开始实例化也生成一个对象工厂的对象放在三级缓存中 B需要注入A 就从三级缓存中取出A的对象工厂对象由对象工厂对象来创建A对象或者A的代理对象放在二级缓存里然后从二级缓存里把A的对象或者代理对象注入给B B实例化完就把B放到了一级缓存也就是单例池中完成实例化此时A也可以完成实例化了就把B注入给A 然后实例完的A也放到一级缓存中解决循环依赖
为什么需要三级缓存？解决由代理对象引起的循环依赖
三级缓存里二级缓存的作用？保证单例让对象工厂创建的对象只需要创建一次即可不用多次创建避免多个实例之后只需要从二级缓存中取Bean即可
构造方法引起的循环依赖？使用@Lazy懒加载来解决循环依赖

SpringMVC

请求进来之后首先会到达DispatcherServlet前端控制器是调度中心然后前端控制器把请求给到处理器映射器HandlerMapping 处理器映射器就可以根据请求找到请求对应的方法并返回给前端控制器处理器执行链为什么返回执行链是因为除了请求对应的方法还可能由一系列拦截器返回完执行器链就会由前端控制器给到处理器适配器HandlerAdaptor 由处理器适配器去调度处理器Handler来处理请求然后处理器Handler响应数据给到处理器适配器处理器适配器处理完相应的参数跟返回值之后就返回给前端控制器ModelAndView 此时的视图只是逻辑视图并不是真正的视图然后前端控制器把ModelAndView给到视图解析器（ViewResolver）视图解析器就会把逻辑视图解析为真正的视图返回给前端控制器View对象然后前端控制器渲染View对象返回请求

前面流程都一样都是请求给到DispatcherServlet然后给到处理器映射器拿到对应执行器链然后给到处理器适配器处理器适配器处理参数调度处理器处理方法处理器执行完返回结果然后处理器适配器根据@ResponseBody注解来调用HttpConvertMessage来将响应结果转换成json数据最后给到前端控制器响应给前端

SpringBoot自动配置原理

在SpringBoot项目中的启动类上有一个注解@SpringBootApplication 这个注解封装了三个注解分别是@ComponentScan扫描包扫描当前包及其子类 @SpringBootConfiguration 表明当前类是一个配置类 @EnableAutoConfiguration 这个注解就是自动装配的核心注解
这个注解通过@Import注解导入对应的配置选择器内部就是读取了该项目和所引用jar包的classpath下的META-INFO下的spring.factories文件中所配置类的全类名这些配置类定义的Bean会基于条件注解所指定的条件来决定是否把对应组件注入到容器中
条件注解会像ConditionalOnClass判断是否由对应的Class文件判断后再决定是否注入

Spring常见注解

Spring常见注解

SpringMVC常见注解

SpringBoot常见注解

MyBatis

MyBatis执行流程

首先就是读取MyBatis配置文件 mabats-config.xml 其中包含了运行环境和映射文件然后就开始创建SqlSessionFactory会话工厂由会话工厂创建SqlSession对象该对象中包含了所有执行Sql的方法接着就是操作数据库的接口 Executor执行器除了操作数据库接口还负责查询缓存的维护 Executor执行方法中有一个MapperStatement类型的参数封装了映射信息最后输入参数映射把JAVA数据类型转换为数据库类型然后响应结果再转换为JAVA数据类型即可完成MyBatis执行流程

MyBatis延迟加载

MyBatis是否支持延迟加载
MyBatis支持延迟加载但是默认是不开启的延迟加载意思就是在需要用到数据时才加载数据不需要数据时就不会加载可以在ResultMap中开启局部的延迟加载或者在MyBatis配置文件中可以配置延迟加载LazyLoadingEnable=true来开启全局延迟加载
延迟加载底层原理
使用CGLIB创建目标对象的代理对象然后通过invoke 方法来查看目标方法是不是null值执行sql查询获取数据之后再通过set设置属性值完成数据的加载

MyBatis多级缓存

一级缓存：基于PerpetualCache的HashMap本地缓存存储作用域时Session级别当Session进行flush或者close的时候缓存会清空默认开启一级缓存
二级缓存：二级缓存也是基于PerpetualCache的HashMap本地缓存不过作用域是namespace和mapper 不会依赖于SqlSession 在mybatis配置文件中开启二级缓存然后在mapper里加上标签让二级缓存生效
mybatis只要进行了删除修改新增操作就会清空某一个作用域内的缓存二级缓存需要实现Serializable接口只有会话提交关闭后一级缓存的数据才会转移到二级缓存中

SpringCloud

网关校验用户信息及向下游传递

就是在网关里用过滤器拿到请求头中的token 解析出来用户ID 然后通过exchange.mutate方法向下游传递网关做完了然后就是从网关传递中拿到用户ID 在公共模块里用拦截器拦截请求拿到请求头中的用户ID 然后存到ThreadLocal中这样每一个微服务自己就有用户ID了后续就是在公共模块中通过MVCConfig配置需要条件注解来注册组件因为网关没有引入MVC 然后再META-INFO下自动装配
网关传递完之后有的是通过OpenFeign远程调用的不经过网关所以需要在OpenFeign中定义拦截器拿到远程调用的用户ID 然后向下游传递

雪崩问题

就是由于调用链路中某个服务故障然后导致调用这个服务也开始故障如果并发量高占用过多tomcat资源就会导致其他服务也故障从而引起服务雪崩
原因
服务之间相互调用出现故障或宕机
没有做好服务故障的异常处理
调用链中级联失败导致集群宕机
解决思路
请求限流也叫流量整合
线程隔离
服务熔断统计异常比例达到或超出就会走fallback逻辑也叫服务降级

分布式事务

使用Seata来实现分布式事务的管理 Seata中有三个部分分别是TC（事务协调者） RM（资源管理器） TM（事务管理者）
TC就是维护全局和分支事务的状态 TM是定义全局服务的范围 RM是管理分支事务
XA模式
一阶段执行sql但是不提交只报告状态占用整个DB锁等所有事务都执行完才确定提交/回滚保证强一致性性能低
AT模式
一阶段执行sql并提交但是会做一个undolog数据快照然后二阶段如果所有分支事务成功就删除快照如果失败需要回滚就根据快照回滚但是会产生脏写问题
脏写问题
就是一阶段获取DB锁执行提交还没到二阶段然后又来个进程继续执行了一遍一阶段导致多次执行sql 因此Seata设计了全局锁由Seata管理就是在执行完sql之后提交之前获取全局锁然后一直到二阶段删除快照/回滚之后才释放全局锁在此期间其他线程无法获取无法进行写因此解决了脏写问题和XA不同的是全局锁是行锁只操作当前行 XA是整个DB锁还有个问题如果分支事务没有被Seata管理那么就无法获取全局锁
TCC模式
和AT模式类似一阶段执行完直接提交但是二阶段不用执行快照而是人为编写数据恢复逻辑之后数据回滚就走人为逻辑来回滚不用全局锁和释放了数据库性能更好但是有代码侵入最终一致需要做幂等处理

最大努力通知

就是人为实现事务去不断通知消息等事务执行完返回ACK确认从而达到事务状态也是最终一致性

MQ

可靠性

发送者可靠性
通过配置开启发送者确认机制发送成功会返回ACK确认失败返回NACK
MQ可靠性
做持久化交换机持久化队列持久化消息持久化 3.12版本之后MQ都是用的Lazy Queue 直接把消息存到磁盘中会缓存一部分到内存里

处理消息堆积
MQ中有大量消息怎么办
提高消费者数量在消费者中开启线程池多线程处理消息使用惰性队列
消费者可靠性
通过消费者确认机制消费完消息返回ACK确认 NACK失败 MQ再次投递 REJECT拒绝 MQ删除 SpringAMQP开启auto
不开启失败重连就会一直投递耗费CPU 开启失败重连机制消息投递失败会重新发消息最多不超过三次如果三次还是失败需要对消息处理一般是指定一个交换机指定一个队列叫错误队列把失败三次的消息发送到错误队列里

幂等处理

就是消息处理一次和多次效果是一样的避免并发错误
唯一消息ID
通过设置消息转换器来让MQ带上唯一消息ID 然后消息进来的时候先从数据库/redis查ID 如果有代表已经消费过不管如果没有代表消息第一次来就开始消费消息然后最后把消息ID放到数据库/redis 保证幂等性
业务逻辑
结合业务逻辑和需求对非幂等业务加上业务判断确保幂等性
支付服务和交易服务当用户支付完成mq发消息通知交易服务把订单改为已支付但是网络原因没有发送成功此时用户退款了把订单改成了退款 mq重试消息发来了把订单改为已支付因此交易服务可以做逻辑判断来实现幂等就是更改订单之前查看订单状态是否是未支付如果是就修改不是就不修改保证幂等性
不同微服务之间确保一致性
比如交易服务和支付服务交易服务完成后会基于MQ去异步通知支付服务来完成订单同步
然后确保消息的可靠性做了生产者确认机制消费者确认机制失败重试机制并且失败三次会将是失败消息发送给错误队列以便后续做调整还做了MQ的消息持久化来避免因宕机导致的消息丢失
最后做了业务幂等来保证消息重复投递导致数据异常

延迟消息

死信交换机
死信分为三种情况
消息处理失败
投递队列消息满了
消息过期
如果这三个死信所在的队列通过配置dead-letter-exchange只当了一个交换机这个就是死信交换机
通过死信交换机来做了延迟消息的处理完成下单三十分钟之内支付不支付就会发送延迟消息更改订单状态

MQ高可用

高可用就要搭建集群 MQ集群分为普通集群镜像集群仲裁队列
普通集群
各个节点中交换机相同队列不同但是会在各个节点保存其他节点的队列引用当消费者选择的节点是其他节点的队列时就会通过引用的队列发送给其他节点但是如果宕机消息就会丢失

镜像集群
类似于主从集群不同节点之间共享信息创建队列的节点称为主节点备份到其他节点称为镜像节点
每一个节点既有可能是主节点又有可能是镜像节点
主节点操作完成就会同步给镜像节点
但是还是存在丢失数据的可能性

仲裁队列
是在3，8版本之后引入的功能仲裁队列和镜像集群几乎相同但是主从同步是基于Raft实现的具有强一致性消息难以丢失

Nacos和Eureka

Nacos和Eureka都支持心跳检测但是Eureka30s检测一次而nacos5s检测一次并且nacos还支持服务端主动提供心跳状态仅限于永久实例
临时示例心跳不正常会被剔除永久实例不会
nacos服务变更会主动推送消息推送更及时 Eureka只会30s拉取一次服务
nacos集群采用AP模式但是也支持CP Eureka只支持AP

负载均衡策略

随机轮询集群优先

服务保护

监控接口以及各种状态

SkyWalking

线程隔离

线程池隔离
每一个服务会申请一个线程池来管控隔离性较好但是管控资源会很麻烦性能一般但是隔离性好
信号量隔离
不需要浪费其他资源直接在服务调用时根据计数器来实现隔离作用隔离性一般但是性能好

滑动窗口算法

把时间划分为多个窗口每个窗口时间跨度默认是1s
然后每个时间跨度内会分成默认两个区间每个区间都有独立的计数器
当请求到达时会根据当前时间减去时间跨度的最近的下一个小区间以此为准查看两个小区间内的所有请求超没超上限
区间分的越多就越准确但是性能就越低

漏桶算法

用队列实现请求进来了就入桶然后一个个往外漏出去如果桶满了请求就会丢弃可以达到整流QPS的作用

令牌桶算法

内部就是基于计数器加一减一来实现计数器随着时间区间自增下一个时间区间就重置然后请求进来就减一实现简单成本低但是有可能会造成QPS忽高忽低的情况就是在1s末来了十个请求全部消耗完 2s又十个所以在这一秒内就是QPS20 因此不使用忽高忽低的情况适用于热点参数限流

Sentinel限流和GateWay限流

GateWay限流实现简单就是通过Redis实现的令牌桶算法来进行限流
而Sentinel内部就比较复杂
默认采用滑动窗口算法来限流服务熔断也是采用的滑动窗口算法
限流之后可以快速失败或者排队等待排队等待是用的漏桶算法
热点参数限流用的是令牌桶算法

任务调度

使用了xxl-job来实现任务调度
xxl-job路由策略有哪些
平时用的比较多的就是轮询故障转移分片广播
xxl-job执行失败怎么解决
路由策略选择故障转移使用健康的实例来执行任务
设置重试次数
查看日志+邮件告警来通知负责人解决
如果有大数据量的任务需要同时处理怎么解决
路由策略选择分片广播部署集群让多个实例一块执行
在任务执行代码中可以获取分片总数和当前分片按照取模的方法分摊到各个实例执行

集合

ArrayList

数据结构数组

数组是一个用连续得内存空间存储相同数据类型得线性数据结构
创建数组时会在栈内存中存储数据名然后指向堆内存存储的数据首地址用索引进行寻址

寻址公式：a[i] = baseAddress + i * dataTypeSize
baseAddress是起始地址 dataTypeSize是元素类型得大小 int就是4个字节
然后通过索引i来实现快速定位数据
为什么数组索引从0开始不从1开始呢
在根据数组索引获取数据过程中是根据寻址公式来进行获取得寻址公式就是首地址 + 索引 * 数据类型大小
如果变成1 就对于CPU多了一个减法操作
查找得时间复杂度
如果根据索引查找就是O（1）如果是未排序得就是O（n）如果排序了用二分查找就是O（logn）
插入删除复杂度
插入删除需要操作整个数组所以平均时间是O（n）

ArrayList源码分析

扩容

ArrayList底层实现原理
底层是用动态得数组实现的
ArrayList初始容量为0 当第一次往里添加数据时会初始化容量为10
在扩容时会变为原来容量的1.5倍每次扩容都要拷贝数组
在添加数据的时候要确保已使用长度+1之后可以存下下一个数据然后计算数组的容量如果超过了当前数组长度就调用grow方法扩容变成原来的1.5倍确保新增的数据有地方存储之后就将新元素添加到位于size的位置上添加成功返回布尔值
如何实现数组和List之间的转换
数组转List：调用JDK的java.utils.Arrays工具类的asList方法并且转换List之后如果修改数组的内容 List会受影响因为底层使用的Arrays类中的一个内部类ArrayList来构造的集合在这个集的构造器中把我们传入的这个集合进行了包装最后都是指向的同一个额内存地址
List转数组：调用List的toArray方法无参toArray方法返回Object数组传入初始化长度的数组对象返回该对象数组 List用toArray转数组后如果修改了List内容数组不会影响当调用了toArray以后底层是进行了数组的拷贝跟原来元素没关系了是一个新的内存空间

LinkedList

单向链表
链表中每一个元素都是一个结点
物理存储单元上非连续非顺序的存储结构
每个结点包含两个部分一个是数据一个是后继指针next
双端链表
有两个指针一个后继指针一个前驱指针

ArrayList和LinkedList区别

底层数据结构
ArrayList底层是动态数组的结构实现 LinkedList底层是通过双端链表的结构实现
效率
ArrayList可以根据索引查询复杂度是O（1）LinkedList不支持索引查询
查找未知索引ArrayList需要遍历是O（n）
ArrayList删除和新增对头节点是O（1）对其他节点都是O（n）
LinkedList删除和新增对头尾节点和已知节点都是O（1）其他节点需要遍历都是O（n）
占用空间
ArrayList占用空间是连续的且只需要存储数据
LinkedList占用空间不连续而且还要多存储指针空间占用空间大
线程安全
二者都不是线程安全的
可以在方法内使用局部变量是线程安全的
可以通过Collections对二者进行包装加锁消耗一部分效率实现线程安全

数据结构

红黑树

也叫平衡二叉树是一种自平衡的二叉搜索树
红黑树性质

节点分成红黑二色
根节点是黑色
叶子节点是黑色
红色节点的子节点是黑色
从任一节点到黑色节点的所有路径都包含相同数目的黑色节点

红黑树性质为了保证稳定如果不符合性质就要发生旋转然后来保证平衡

散列表

散列表就是哈希表根据键找值的数据结构由数组演化而来
将key映射为数组下标的函数就是散列函数表示为hashValue = hash(key)
有三个基本要求得到的hashValue必须大于0 相同的key必须得到相同的hashValue 不同的key必须得到不同的hashValue
第三个难以实现因此会出现哈希冲突（散列冲突哈希碰撞）
用拉链法解决哈希冲突就是发生哈希冲突时在后面加一个链表拉链数量大于8 会变成红黑树

HashMap实现原理

底层使用hash表数据结构即数组加链表或红黑树
当往HashMap中put元素时会根据Key做一个hash运算计算当前对象的元素所在数组的下标
然后进行存储如果发生哈希冲突就把key-value放入链表或者红黑树中一般是链表如果数组长度大于64且链表长度大于8会转为红黑树
获取时找到hash值对应的下标判断key是否相同相同则取出数据

jdk1.7和1.8中hashMap有什么区别？
在1.7之前的拉链法并没有红黑树的实现发生哈希冲突都是以链表形式存储
1.8的拉链法就有了红黑树处理链表过长导致效率变慢的因素如果数组长度大于64且链表大于8就会转为红黑树如果红黑树节点小于6个就会还原成链表

HashMap的put具体流程

HashMap是懒加载在创建对象时并没有初始化数组
在无参构造函数中设置了默认的加载因子为0.75

HashMap的put方法具体流程？

判断键值对数组table是否为空或为null 如果是就执行resize进行扩容（初始化）
根据key计算hash值找到数组索引
判断table[i] == null是否成立成立直接插入
如果不成立
4.1 判断table[i]首个元素是否和key一样如果一样就覆盖
4.2 判断table[i]是不是红黑树如果是红黑树就走红黑树的逻辑插入键值对
4.3 遍历table[i] 用尾插法插入数据然后判断链表长度是否大于8 大于8就把链表转换为红黑树
插入成功后判断++size是否超过了最大容量threshold（数组长度 * 0.75）如果超过就进行扩容

HashMap扩容机制

HashMap的扩容机制是什么？
添加元素或者初始化时需要调用resize方法扩容第一次初始化长度为16 以后每次扩容都是达到了扩容阈值（数组长度 * 0.75）
每次扩容的时候都是扩容之前容量的两倍
扩容之后会新建一个数组然后把旧数组的数据挪动到新数组中
如果是没有hash冲突的节点直接使用e.hash & (newCap - 1)取模重新计算索引位置
如果是红黑树就用红黑树的添加逻辑
如果是链表就需要遍历链表判断e.hash & oldCap是否为0 如果是就直接拷贝即可如果不是就把之前索引加上增加的数组大小这个位置上

HashMap寻址方法
首先进行hash运算
然后调用hash方法也就是扰动算法可以尽可能避免哈希冲突
最后用数组长度-1与运算代替取模

为什么数组长度一定要是2的倍数
计算索引效率更高因为2的倍数可以用与运算代替取模
扩容时重新计算索引效率更高 hash & oldCap ==0的元素留在原来位置否则新位置 = 旧位置 + oldCap

HashMap在1.7下多线程死循环问题
1.7在扩容时因为采用头插法所以进行数据迁移就有可能导致死循环
比如有两个线程线程一读到数据时正准备扩容线程二介入开始进行扩容因为是头插法链表顺序会反过来之前顺序比如AB 扩容后就是BA 线程二结束
线程一继续执行就会发生死循环
线程一再进行头插法时由于另一个线程的原因 B的next指向了A 所以导致了 B指向A A指向B 形成循环
到JDK8时就解决了该问题采用了尾插法避免死循环

并发编程篇

线程基础

线程和进程的区别

进程就是一个应用程序进程包括多个线程一个线程就是一个指令流
二者对比
进程是正在运行程序的实例进程中包含了线程每个线程执行不同的任务
不同的进程使用不同的内存空间在当前进程下的所有线程共享内存空间
线程更轻量线程上下文切换一般要比进程上下文切换成本低

并行与并发

二者有什么区别
在多核CPU下并发是同一时间应对多件事的能力多个线程轮流使用一个或者多个CPU
并行是同一时间动手做多件事情的能力一个四核CPU可以同时执行4个线程

创建方式

继承Thread类
实现Runnable接口
实现Callable接口
线程池创建线程

Runnable和Callable有什么区别
Runnable没有返回值
Callable有返回值通过泛型来定义返回值的类型可以通过FutureTask来配合拿到异步线程的结果
Callable的call方法可以抛异常而Runnable的run方法不能抛异常

启动线程的时候start方法和run方法有什么区别
run方法还是主线程在运行可以调用多次
而start方法才是开启了一个新线程来执行的只能调用一次

线程的状态以及切换

线程包含哪些状态
新建状态（NEW）可运行（RUNNING）阻塞（BLOCKED）等待（WAITING）时间等待（TIMED_WALTING) 终止（TERMINATED）
各个状态如何切换

创建线程时是新建状态
调用start方法变成可执行状态
线程获取到了CPU的执行权执行结束是终止状态
可执行状态中如果没有获取到CPU的执行权就会切换其他状态
- 如果没有获取锁就会进入阻塞状态获取之后再切换回可执行
- 如果线程调用了wait方法就会进入等待状态其他线程调用notify就会切换成可执行状态
- 如果线程调用sleep方法就会进入计时等待状态到时间后就会切换成可执行状态

按顺序执行线程

创建三个线程如何按顺序执行
通过join方法比如t1线程执行然后在t2线程中加入t1.join确保t1结束之后才执行t2 然后在t3中加入t2.join 确保t2结束之后才执行t3 从而确保按顺序执行
notify和notifyAll有什么区别
notify只唤醒随机一个线程
notifyAll唤醒所有线程

wait和sleep方法的异同

共同点
二者都是让当前线程暂时放弃CPU的使用权进入阻塞状态
不同点

方法归属不同
wait方法是Object的成员方法
sleep是Thread的静态方法
醒来时机不同
wait可以被notify唤醒如果wait不唤醒就会一直等待下去
他们都可以被打断唤醒
锁特性不同
wait方法调用前回获取wait对象的锁 sleep不用
wait方法执行后回释放对象锁允许其他线程获得锁
sleep如果在synchronized代码块中执行不会释放锁

停止线程

使用退出标志停止使线程正常退出也就是run方法执行完后线程终止
使用stop方法强行终止方法已废弃
使用interrupt中断线程
打断阻塞的线程（sleep wait join）会抛出InterruptedException异常
打断正常的线程可以根据打断状态来标记是否退出线程

线程安全

synchronized原理

Synchronized是对象锁采用互斥的方式在同一时刻最多只能有一个线程持有锁其他线程再想获取就会阻塞

monitor监视器分为三个部分
Owner 存储当前获取锁的线程只能有一个
EntryList 存储的没有抢到锁的线程处于blocking阻塞状态
WaitSet 关联了调用wait方法的线程处于waiting状态

Synchronized原理

synchronized对象锁采用互斥的方式让同一个时刻最多只能有同一个线程持有锁
底层是由monitor实现的是jvm级别的对象线程获取锁就是让对象关联monitor
monitor中有三个属性 owner entryList waitSet
owner是关联的当前获取锁的线程只能有一个 entryList关联的是处于阻塞的线程 waitSet关联的是处于waiting状态的线程

synchronized进阶

monitor属于重量级锁因为是jvm提供的所以需要内核态和用户态的切换进程的上下文切换性能较低成本较高
在jdk1.6之后引入了轻量级锁和偏向锁适用于没有竞争的场景比如锁重入来减少损耗
对象的内存结构
在HotSpot虚拟机中对象在内存存储分为三个部分对象头实例数据和对齐填充

每个对象都可以关联一个Monitor对象如果给对象上了重量级锁synchronized之后该对象头的Mark Word就被设置成指向Monitor对象的指针

偏向锁
轻量级锁在没有竞争时每次重入仍然需要CAS操作因此偏向锁对重入进行了优化第一次使用CAS将线程ID设置到对象的Mark Word头之后发现只要是同一个ID 就是重入不用重新CAS 以后只要不发生竞争这个对象就归线程所有

你了解过锁升级吗？
java中的synchronized有偏向锁轻量级锁重量级锁三种形式分别对应锁只被一个线程持有不同线程交替持有多线程竞争锁三种情况

谈一谈JMM（Java内存模型）

JMM是Java Memory Model Java内存模型定义了共享内存中多线程读写操作的规范通过这些规则来规范对内存读写操作的正确性
JMM把内存分为两块一个是私有线程的工作内存一个是所有线程共享的内存叫主内存
线程跟线程之间是相互隔离的同步数据是通过主内存来交互的

CAS

CAS叫Compare And Swap 比较再交换是一种乐观锁思想在无锁状态下保证线程操作共享数据的原子性

在JMM中线程交换数据会将主内存的数据和自己的旧数据进行比对如果一样就同步数据如果不一样就开启自旋
自选就是进行CAS失败后会重新从主内存中获取一份数据然后再执行自身线程逻辑再对主内存进行CAS判断如果一样就同步数据不一样继续自旋这个操作也叫自旋锁
CAS底层是调用的unsafe类中操作系统实现的CAS指令

CAS你知道吗

CAS全程Compare And Swap 比较再交换是一种乐观锁的思想在无锁状态下可以保证数据操作的原子性
CAS用到的地方比如AQS框架 AtomicXXX类等
操作共享变量的时候使用的自旋锁效率上更高一些
CAS底层是调用的Unsafe类的方法是操作系统提供的

乐观锁和悲观锁的区别

CAS就是基于乐观锁的思想认为没有线程竞争哪怕有了导致数据不一致再重试获取就行
synchroinzed是基于悲观锁的思想认为线程竞争一直存在上了锁谁也无法获取改完了释放锁才可以获取

Volatile

一个共享变量（成员变量静态成员变量）被Volatile修饰后就有了两层含义

保证线程间的可见性
用volatile修饰共享变量能防止编译器优化发生让一个线程对变量的修改对另一个线程可见
禁止进行指令重排序
volatile修饰的变量会在读写时加入不同的屏障防止其他操作越过屏障从而达到阻止重排序的效果

AQS

AbstractQueuedSynchronizer 抽象队列同步器时构建锁或者其他同步组件的基础框架

AQS常见的实现类
ReentrantLock 阻塞式锁
Semaphore 信号量
CountDownLatch 倒计时锁
基本工作机制
AQS内部有一个volatile修饰的state 0是无锁 1是有锁线程进来就会修改state的值然后占有锁后续线程进来抢不到锁会在一个先进先出的双向队列里等待直到state为0 就会取出头部的线程让他占有锁

什么是AQS

是多线程中的队列同步器是一种锁机制作为一个基础框架使用的像ReentrantLock Semaphore就是基于AQS实现的
AQS内部维护了一个先进先出的双端队列存储的是排队的线程
AQS内部还有一个volatile修饰的state属性 0就是无锁 1就是有锁
对state修改时用到了cas操作来保证原子性

ReentrantLock

就是可重入锁

可中断
可以设置超时时间
可以设置公平锁
支持多个条件变量
支持重入锁

主要是利用CAS+AQS队列来实现支持公平锁和非公平锁两者实现类似
构造方法支持传入boolean参数默认是非公平锁传入true就是公平锁 false就是非公平锁公平锁效率没有非公平锁高多个线程访问公平锁表现出较低的吞吐量

ReentrantLock实现原理

ReentrantLock表示可重入锁调用方法获取锁之后再次调用lock 是不会阻塞的
ReentrantLock利用CAS+AQS队列来实现
支持公平锁和非公平锁提供的构造器中无参默认是非公平锁也可以传参设置公平锁

synchronized和lock区别

语法层面
synchronized是关键字源码在jvm中用C++实现
Lock是接口源码由JDK提供用java语言实现
使用synchronized时退出同步代码块会自动释放锁而使用lock时需要用unlock来释放锁
功能层面
二者都属于悲观锁都具备互斥同步可重入功能
Lock提供了很多synchronized不具备的功能比如公平锁可打断可超时多条件变量（await方法）
Lock有适合不同场景的实现如ReentrantLock ReentrantReadWriteLock（读写锁）
性能层面
没有竞争时 synchronized做了很多优化偏向锁轻量级锁性能好
竞争激烈时 Lock的实现会有更好的性能

死锁条件

死锁：一个线程获取多把锁就容易发生死锁比如一个线程先占有A锁然后在代码块里获取B锁另一个线程先占有B锁在代码块里获取A锁两个线程start就会死锁
如何进行死锁诊断
出现死锁现象可以使用jdk的工具jps（输出JVM中运行的进程状态信息）和jstack（查看java进程内的线程堆栈信息）

还可以使用可视化工具jconsole和VisualVM（故障处理工具）
二者都在jdk中 VisualVM高版本不会集成了需要自己下载并且还可以解决OOM问题

ConcurrentHashMap

线程安全的hashMap
1.7采用分段的数组加链表

加锁必然导致性能的下降
1.8就跟HashMap底层用到的一样了就是数组加链表/红黑树实现然后通过CAS和synchronized来确保线程安全

聊一下ConcurrentHashMap

底层数据结构

JDK1.7采用分段的数组+链表实现
JDK1.8采用的数据结构跟HashMap的结构一样都是数组+链表/红黑树

加锁的方式

JDK1.7是用的Segment分段锁底层使用的是ReentrantLock
JDK1.8采用CAS添加新节点采用synchronized锁住链表或者红黑树首节点相对Segement分段锁粒度更细性能更好

导致并发出现的根本原因？

原子性 synchronized lock
内存可见性 volatile
有序性 volatile

线程池

线程池原理及参数

核心参数

corePoolSize 核心线程数
maximumPoolSize 最大线程数目 = （核心线程 + 救急线程）
keepAliveTime 生存时间 - 救急线程的生存时间
unit 生存时间 - 救急线程的生存时间的单位
workQueue 阻塞队列没有线程可用时就会把任务加入到这个队列队列满就会创建救急线程
threadFactory 线程工厂来给线程命名和设置守护线程
handler 拒绝策略线程繁忙加上队列也满了就会出发拒绝策略
1. AbortPolice 直接抛出异常默认策略
2. CallerRunsPolicy 由调用者所在的线程来执行任务
3. DiscardOldestPolicy 丢弃阻塞队列中最靠前的任务并执行当前任务
4. DiscardPolicy 直接丢弃任务

执行原理

常见的阻塞队列

workQueue 没有空闲核心线程时会将任务放到阻塞队列中队列满就会创建救急线程执行任务
1.ArrayBlockingQueue 基于数组结构的有界阻塞队列 FIFO
2.LinkedBlockingQueue 基于链表结构的有界阻塞队列 FIFO
3.DelayedWorkQueue 是一个优先队列可以保证每次出队的任务都是当前队列中执行时间最靠前的
4.SynchronousQueue 不存储元素的阻塞队列每次插入操作必须等待一个移除操作

LinkedBlockingQueue和ArrayBlockingQueue的异同
LinkedBlockingQueue是默认无界的支持有界底层是链表懒加载的只有创建节点时才会添加数据头尾各有一把锁因此出队入队互不影响性能好
ArrayBlockingQueue是强制有界的底层是数组提前初始化Node数组只有一把锁因此相互影响操作性能不好

确定核心线程数

高并发执行任务时间短->就是CPU核数 + 1 减少线程上下文切换
并发不高任务执行时间长如果是IO密集型任务就是CPU核数 * 2 + 1 如果是计算密集型任务就是CPU核数 + 1
并发高任务执行时间长就需要考虑整体架构的设计查看是否可以做到缓存增加服务器

线程池的种类

线程池的种类有哪些

newFixedThreadPool：创建一个定长线程可控制线程最大并发数超出线程会在队列中等待
newSingleThreadExecutor：创建一个单线程化的线程池只会用唯一的工作线程来执行任务保证所有的任务按照指定顺序FIFO执行
newCachedThreadPool 创建一个可缓存线程池都是临时线程可以灵活回收空闲线程
newScheduledThreadPool：可以执行延迟任务的线程池支持定时及周期性任务执行

为什么不建议使用Executors去创建线程池
因为FixedThreadPool和SingleThreadPool创建的阻塞队列长度为Integer的最大值可能堆积大量请求导致OOM
CachedThreadPool创建的线程数量也是Integer的最大值创建大量线程同样导致OOM
建议使用ThreadPoolExecutor的方式去创建

使用场景

线程池使用场景

还有一个是当多个接口没有关联并且并行执行时就可以通过线程池来同步提交任务然后缩短耗时

控制某个方法允许并发访问线程的数量
信号量隔离在多线程中可以使用工具类Semaphore 通过信号量设置来及性能隔离
创建Semaphore对象然后给定一个容量
acquire请求一个容量信号量-1
release释放一个容量信号量+1
从而达到控制并发线程
也可以通过线程隔离参考sentinel

谈一谈ThreadLocal

ThreadLocal是一个线程内部存储类让多个线程只操作自己内部的值从而实现线程数据隔离避免争用引发的线程安全问题
ThreadLocal实现了线程内的资源共享
每个线程内有一个ThreadLocalMap类型的成员变量用来存储资源对象

调用set方法就是以ThreadLocal自己为key 资源对象为value 放入当前线程的ThreadLocalMap集合中
调用get方法以ThreadLocal自己为key 在当前线程中查找关联的资源值
调用remove方法就是以ThreadLocal自己作为key 移除当前线程关联的资源值

ThreadLocal内存泄漏问题
ThreadLocalMap中的key是弱引用值是强引用 key会被GC释放内存关联value的内存不会被释放因此导致内存泄漏解决方法就是主动remove释放key value

JVM

Java Virtual Machine Java二进制字节码的运行环境
好处：一次编写到处运行和自动内存管理垃圾回收机制

JVM组成

程序计数器

程序计数器（PC Register）
什么是程序计数器？
线程私有的内部保存的字节码的行号用来记录正在执行的字节码的地址

JAVA堆

Java堆是一个线程共享的区域用来保存对象实例，数组等当堆中没有内存空间可分配时就会抛出OutOfMemoryError异常即OOM

Java8的元空间就是方法区在Java7中方法区是保存在堆中的叫做永久代但是保存在堆中如果过小OOM 过大浪费所以为了避免OOM 直接在java8中放到了内存中
你能介绍一下Java堆吗

就是线程共享的区域主要用来保存对象实例数组等内存不够就抛出OOM异常 OutOfMemoryError
组成：老年代 + 年轻代
- 年轻代被划分为两部分 Eden区存放刚创建的对象数组和两个幸存者Survivor区
- 老年代主要保存生命周期长的对象一般是一些老的对象
JDK1.7和JDK1.8的区别
- 1.7中堆中有个永久代存储的是类信息静态变量常量编译后的代码
- 1.8移除了永久代把这块空间存储到了本地内存的元空间中防止内存溢出OOM

虚拟机栈

Java Virtual Machine Stacks（java虚拟机栈）

每个线程运行时需要的内存就是虚拟机栈先进后出
每个栈由多个栈帧（frame）组成对应每次发昂发调用时所占用的内存包括参数，局部变量，返回地址
每个线程只能有一个活动栈就是当前正在执行的方法

垃圾回收是否设计到栈内存？
不涉及垃圾回收是指堆内存栈内存回收是把栈帧弹出之后就会释放
栈内存分配越大越好吗？
不是栈内存默认1024K 如果分配大就会导致线程数变少
方法内的局部变量是否线程安全
如果方法内部的局部变量没有逃离方法的作用范围那就是线程安全的
如果方法内部的局部变量引用了对象并逃出了作用范围比如返回值传参那就不是线程安全的
栈内存溢出情况
栈帧过多导致溢出递归
栈帧过大导致溢出
堆和栈的区别是什么

栈内存一般存储的是局部变量和方法调用堆内存是存储java对象和数组堆会GC垃圾回收栈不会
栈内存是线程私有的堆是线程共享的
两者溢出的异常不同
- 栈内存不足是StackOverFlowError 栈溢出
- 堆内存不足是OutOfMemoryError 内存不足

方法区

解释一下方法区？

方法区（Method Area）是线程共享的内存空间
主要存储类的信息以及运行时常量池
虚拟机启动的时候创建关闭的时候释放
如果方法区内存无法满足所需大小就会抛OutOfMemoryError：MetaSpace异常

常量池
类似于一张表虚拟机指令根据这张常量表可以找到要执行的类名方法名参数类型字面量信息
运行时常量池
常量池是.class文件中的当该类被加载它的常量池信息就会放入运行时常量池并把里面的符号地址变为真实地址

直接内存

直接内存：不属于JVM的内存结构不由JVM管理是虚拟机的系统内存常见于NIO操作用于数据缓冲区吞吐量大分配回收成本较高读写性能好

常规IO操作

常规IO有两个缓冲区系统缓冲区和Java缓冲区因为java无法直接操作系统缓冲区所以需要从系统缓冲区复制一份给java缓冲区造成了不必要的复制性能不好

NIO操作

直接内存的存在就不用去管数据的多份复制 java代码和系统都可以访问减少复制次数提高性能
你听过直接内存吗
并不属于JVM中的内存结构不由JVM管理是虚拟机的系统内存
常见于NIO操作用于数据缓冲区分配回收成本较高但是读写性能好不受JVM内存回收管理

类加载器

类加载器与双亲委派

什么是类加载器
JVM只会运行二进制文件类加载器就是将字节码文件加载到JVM中从而让java程序能够启动起来
类加载器有哪些
顺序是自上而下的

启动类加载器（BootStrapClassLoader）加载JAVA_HOME/jre/lib下的jar包
扩展类加载器（ExtClassLoader）加载JAVA_HOME/jre/lib/ext下的jar包
启动类加载器（AppClassLoader)加载classPath下的类
自定义类加载器（CustomizeClassLoader）自定义加载规则

什么是双亲委派模型
加载一个类先委托上一级的加载器进行加载如果上级加载器也有上级就继续向上委托如果该类委托上级没有被加载子加载器尝试加载该类如果可以加载就向下派发
为什么JVM采用双亲委派模型

通过双亲委派机制可以避免某一个类重复被加载当父类已经加载后则无需重复加载保证唯一性
为了安全保证类库API不会被修改

类装载

类从加载到虚拟机开始直到卸载生命周期包括了：加载验证准备解析初始化使用和卸载验证准备解析三部分统称为连接（linking）

加载
通过类的全名获取类的二进制数据流
解析二进制数据流作为方法区的数据结构
创建类实例表示该类型作为方法区这个类的各种数据的访问入口

验证
验证类是否符合JVM规范安全性检查
文件格式验证元数据验证字节码验证都是格式检查检查格式是否错误语法是否错误字节发是否合规
符号引用验证：Class文件在常量池中会通过字符串来记录自己将要使用的其他类或者方法检查他们是否存在
准备
static变量只会分配空间设置默认值赋值在初始化阶段完成
static final修饰的基本类型或字符串变量会分配空间并且赋值
static final的引用类型分配空间赋值在初始化阶段完成
解析
把符号引用转换为直接引用
初始化
对类的静态变量静态代码块进行初始化操作
如果初始化一个类其父类没被初始化那就优先初始化其父类
如果包含多个静态变量和静态代码块则自上而下顺序依次执行
使用
JVM从入口方法开始执行用户的代码

说一下类加载的执行过程

加载：查找和导入class文件
验证：保证加载类的准确性
准备：为类变量分配内存并设置初始值
解析：把类中的符号引用转换为直接引用
初始化：对类的静态变量静态代码块执行初始化操作
使用：JVM从入口方法开始执行用户代码
销毁：用户代码执行完毕后 jVM开始销毁创建的Class对象

垃圾回收

什么时候垃圾器回收

如果一个或者多个对象没有任何的引用指向它了就是垃圾如果定位了垃圾就会被垃圾器回收定位垃圾的方法有两种引用计数器和可达性分析算法
引用计数法
一个对象被引用了一次就会在对象头上递增一次引用次数如果引用次数为0 就代表这个对象可回收
但是当出现了循环引用的时候引用计数法就会失效引发内存泄漏

可达性分析算法
现在虚拟机都是通过可达性分析算法来确定哪些是垃圾
通过根节点GC Roots开始扫描堆中的对象以GC Roots为起点的对象都是正常对象如果以GC Roots为起点扫描不到那就是垃圾代表可以回收
哪些对象可以作为GC Root

虚拟机栈（栈帧中的本地变量表）中引用的对象
方法区类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中JNI（Native方法）引用的对象

垃圾回收算法

分为标记清除算法复制算法标记整理算法
标记清除算法
分为两个阶段标记和清除
1.根据可达性算法把的出的垃圾进行标记
2.对这些标记为可回收的内容进行回收

优点：标记和清除速度较快
缺点：内存不连续碎片化严重
标记整理算法

跟标记清除差不多就是多了一步整理空间的流程没有碎片化的同时导致了性能下降
复制算法

优点：在垃圾较多的时候效率较高清理后内存无碎片
缺点：内存使用率低因为有两片内存空间只使用了一半

分代回收

说一下分代回收

堆的区域划分
在java8中堆分成了新生代和老年代新生代占了1/3 老年代占了2/3 新生代中又分了三部分 Eden区中存放的都是刚创建的对象幸存者区分为from和to 比例是8:1:1
分代回收策略
- 新创建的对象都会到Eden区
- Eden区内存不足就会用可达性分析算法标记Eden和From存活的对象
- 将存货对象采用复制算法复制到to中复制完毕后释放Eden区和from区
- 一段时间后Eden区又不足继续标记Eden区和to区的存活对象复制到from区
- 当幸存者区对象经过多次回收（最多15次）晋升到老年代如果幸存者区内存不足或者对象过大也会提前晋升

MinorGC MixedGC FullGC区别是什么

MinorGC发生在新生代的垃圾回收暂停时间短（STW）
MixedGC 新生代和老年代部分区域的垃圾回收 G1收集器特有的
FullGC 新生代+老年代完整垃圾回收暂停时间长（STW）应尽力避免

STW：StopTheWord 暂停所有应用程序线程等待垃圾回收完成

垃圾回收器

垃圾回收器包括串行垃圾回收器并行垃圾回收器 CMS（并发）垃圾回收器 G1垃圾回收器
串行垃圾回收器
Serial和Serial Old串行垃圾回收器单线程进行垃圾回收堆内存较小适合个人电脑

Serial作用新生代采用复制算法
Serial Old作用老年代采用标记整理算法

垃圾回收时只有一个线程在工作并且Java中所有线程都要暂停（STW）等待垃圾回收完成

并行垃圾回收器
Parallel和Parallel Old是一个并行垃圾回收器 JDK8默认采用此垃圾回收器

Parallel作用新生代采用复制算法
Parallel Old作用老年代采用标记整理算法

垃圾回收时多个线程共同进行垃圾回收性能要好但是还是会暂停所有线程等待垃圾回收线程完成

CMS并发垃圾回收器
全程Concurrent Mark Sweep 是并发的使用标记清除算法的垃圾回收器该回收器针对老年代垃圾回收停顿时间短最大特点就是垃圾回收时不影响其他线程
<img src="https://img2024.cnblogs.com/blog/3633503/202509/3633503-20250914170807753-297961930.png)

初始标记只标记GC Root的引用只标记一代并发标记才开始彻底标记然后重新标记是为了防止运行时会有新增或删除引用虽然也有暂停线程但是时间短

G1垃圾回收器

谈一下G1垃圾回收器

应用于新生代和老年代 JDK9之后默认使用G1
划分成多个区域每个区域都可以充当eden survivor old humongous 其中humongous专门为大对象准备
采用复制算法
响应时间和吞吐量兼顾
分为新生代回收并发标记混合收集
https://www.bilibili.com/video/BV1yT411H7YK?t=180.8&p=128
如果并发失败（回收速度赶不上创建对象速度）就会出发FullGC

强引用软引用弱引用虚引用

强引用：new对象只有所有的GC Roots不通过强引用引用该对象才会被垃圾回收器回收
软引用：配合SoftReference使用仅有软引用引用该对象时第一次垃圾回收不会回收该对象如果第一次之后内存仍不足就会回收该软引用对象
弱引用：配合WeakReference仅有弱引用引用该对象时无论内存是否充足都会回收弱引用对象
虚引用：配合引用队列使用被引用对象回收时会将虚引用入队由Reference Handler线程调用虚引用相关方法释放直接内存

JVM实践

JVM在哪调优

war包部署在tomcat中设置
修改TOMCAT_HOME/bin/catalina.sh文件
jar包部署设置

JVM调优参数

JVM调优主要是更改年轻代老年代元空间内存大小和垃圾回收器类型

设置堆空间大小
-Xms：设置堆初始化大小 -Xmx：设置堆最大大小最大大小默认是物理内存1/4 初始大小是1/16
堆太小导致年轻代和老年代频繁回收产生STW 暂停用户线程
堆太大如果发生FullGC会扫描整个堆空间暂停用户线程过长
虚拟机栈的设置
每个线程会默认开启1M的内存用于存放栈帧调用参数局部变量等一般256K 通常减少每个线程的堆栈可以产生更多的线程
-Xss128k
Eden区和两个Survivor区大小比例
年轻代晋升老年代阈值
设置垃圾回收收集器
jdk8默认使用并发垃圾回收器可以通过设置参数改成使用G1垃圾回收器
-XX:+UseG1 GC

JVM调优工具

命令工具
- jps 进程状态信息
- jstack 查看java进程内线程的堆栈信息
- jmap 查看堆转信息
- jhat 堆转储快照分析工具
- jstat JVM统计监测工具
可视化工具
- jconsole 对JVM内存线程类的监控
- VisualVM 监控线程内存情况

内存泄漏

一般来说都是堆的内存泄露问的多
解决思路：

获取堆内存快照dump
使用jmap命令拿到运行中程序的dump文件如果文件没启动或者已经退出 jmap就不合适因为jmap只适合运行中的就可以通过配置VM参数设置发生OOM时生成dump文件从而可以进一步分析堆中的情况
使用VisualVM分析dump文件
通过查看堆信息的情况定位内存溢出问题

CPU飙高

CPU飙高的排查与思路
使用top命令查看占用CPU的情况发现哪一个进程占用CPU较高
通过ps命令查看进程中的线程信息
使用jstack命令查看进程中哪些线程出现了问题最终定位问题

企业场景

设计模式

工厂设计模式

工厂模式最大的优点就是解耦不需要跟具体的类打交道只需要把想要的类交给工厂来创建
简单工厂
就是通过一个工厂来创建虽然解耦但是耦合还是存在
工厂方法模式
创建一个工厂接口规定规则然后通过工厂实现类来明确所要创建的类彻底解耦

优点：
用户只知道具体工厂名称即可创建所要的类无需知道类的创建过程
无需对原工厂进行任何修改满足开闭原则
缺点：
每增加一个产品就要增加一个具体产品类和一个对应的具体工厂类增加了系统的复杂度
抽象工厂模式
就是遇到华为和小米的这种不同品牌且都有手机电脑的来看一个工厂方法是不够的抽象工厂就是再加一层先分品牌再分手机还是电脑所以就有了抽象工厂模式

优点：保证客户端只使用同一个产品组的对象
缺点：需要新增产品时所有工厂类都要修改

策略模式

优点：策略类可以自由切换易于扩展
缺点：客户端必须知道所有的客户类策略模式会产生很多的策略类

什么是策略模式
策略模式定义了一系列算法并将眉哥哥算法封装起来使他们可以相互替换且算法的变化不会影响使用算法的客户
一个系统需要动态的在几种算法中选择一种时可以将每个算法封装到策略类中
案例（工厂方法 + 策略）
介绍业务（满减满300九折 500八折 1000七折）
提供多种策略都让Spring容器管理
提供一个工厂准备策略对象根据参数提供对象

大致思路就是在yml文件中配置参数 yaml中key是前端传的不同的策略值是策略的对象名
所有策略的对象是交给了spring容器管理然后在工厂方法中定义map 通过实现Aware接口（ApplicationContextAware）在容器中获取策略对象然后放到map中工厂就可以根据策略类型得到策略对象然后在service中就可以注入工厂方法实现开闭自由解耦合

责任链设计模式

优点：
降低耦合增强可扩展性责任分担
缺点：
责任链较长要涉及多个对象性能较低
增加了客户端的复杂性

常见技术场景

单点登录

单点登录 Single Sign On（SSO）只登陆一次就可以访问所有信任的应用系统
使用JWT
用户发起登录请求返回给前端一个token 前端把token存到请求头中
用户访问其他服务就携带了token 由网关进行验证无效就返回401（认证失败）跳到登陆页面
校验成功再由网关路由到其他服务
传递给下游？OpenFeign？

权限认证？

后台管理系统更注重权限控制最常见的就是RBAC模型
（Role-Based Access Control）
具体实现
五张表（用户表角色表权限表用户角色中间表角色权限中间表）用户角色多对多所以需要一张中间表角色权限多对多需要一张中间表
七张表（用户表角色表权限表菜单表用户角色中间表角色权限中间表权限菜单中间表）

权限认证如何实现
后台管理的相关经验
RBAC的五张表（用户表角色表权限表）
SpringSecurity

数据安全性

对称加密：
文件解密和加密使用同一把密钥
优点：加密速度快效率高
缺点：不安全
非对称加密
公开密钥加密私有密钥解密
优点：安全性更高
缺点：加密解密速度慢
上传数据的安全性如何控制
使用非对称加密给前端一个公钥把数据加密后传到后端后端解密后处理数据
文件大用对称加密不要存敏感信息
文件小要求安全性就非对称加密

日志采集

采集日志是为了定位问题
方式有哪些
常规采集：按天保存一个日志文件
ELK：ElasticSearch Logstash Kibana

项目中日志是这么采集的？
搭建了ELK日志采集系统
ElasticSearch：全文搜索数据引擎可以对数据进行存储分析搜索
Logstash：数据收集引擎可以动态收集数据可以对数据进行过滤分析主要是收集日志
Kibana：数据可视化分析平台来对ES的数据进行分析查询图表化展示

查看日志的命令有哪些
Linux：
实时监控日志的变化：tail -f xx.log
按照行号查询：tail -n 100 xx.log 尾部 head -n 100 xx.log 头部
查询日志中含debug：cat -n xx.log | grep 'debug' 出来的是行号结合上面
按照日期查询:

日志太多处理方式：

生产问题排查

先分析日志查看系统日志或日志文件定位问题
运用远程debug

快速定位系统瓶颈

压测（性能测试）
监控工具链路追踪工具
线上诊断工具 Arthas（阿尔萨斯）

posted @ 2025-09-03 20:21 big4mart 阅读(20) 评论(0) 收藏举报

刷新页面返回顶部

big4mart

面试

Redis-项目

更新策略

缓存问题

超卖问题

分布式锁

分布式锁-Redisson

Redis消息队列

秒杀业务优化

Redis-原理

数据结构

字符串SDS

IntSet

Dict

ZipList

QuickList

SkipList

RedisObject

IO模型

IO多路复用

内存回收策略

内存淘汰策略

Redis持久化

Redis集群服务

主从集群

哨兵集群

分片集群

Mysql

慢查询

如何定位慢查询

分析sql

索引

什么是索引

索引的底层数据结构

聚簇索引 非聚簇索引 回表查询

覆盖索引 超大分页优化

索引失效

sql优化

事务

事务特性

并发事务问题 隔离级别

redo log和undo log

MVCC

主从同步原理

分库分表

框架

Spring

AOP

事务失效的场景

Bean的生命周期

Spring循环依赖

SpringMVC

SpringBoot自动配置原理

Spring常见注解

MyBatis

MyBatis执行流程

MyBatis延迟加载

MyBatis多级缓存

SpringCloud

网关校验用户信息及向下游传递

雪崩问题

分布式事务

最大努力通知

MQ

可靠性

幂等处理

延迟消息

MQ高可用

Nacos和Eureka

负载均衡策略

服务保护

监控接口以及各种状态

线程隔离

滑动窗口算法

漏桶算法

令牌桶算法

Sentinel限流和GateWay限流

任务调度

集合

聚簇索引非聚簇索引回表查询

覆盖索引超大分页优化

并发事务问题隔离级别

数据结构数组

强引用软引用弱引用虚引用