分布式锁

单机

方案比较多，synchronized和juc很丰富

分布式锁

互斥性:在任意时刻，只有一个客户端能持有锁

不会发生死锁:即有一个客户端在持有锁的期间崩溃而没有主动解锁，也能保证后续其他客户端能加锁

文章来源：https://www.cnblogs.com/guozp/p/10341337.html

常见方案

基于数据库
基于分布式缓存（redis、tair等）
基于zk
要基于你的业务场景选择合适方案

数据库(mysql)

基于数据库的ACID以及MVCC(多版本并发控制机)，MVCC是通过保存数据在某个时间点的快照来实现的，不同存储引擎的MVCC实现是不同的,典型的有乐观并发控制和悲观并发控制

基于悲观锁（for update）

select * from table where *** for update
基于乐观锁（version）

乐观锁是基于数据的版本号实现的,表增加一个字段version，每次读取的时候，将version取出，更新的时候，比较version是否一致，一致，处理完后把version加1；不一致，本次未拿到锁
- 表定义（根据需求增加）
  
  id resource status expire version
  
  1 1 2 2019-01-01 12:00:00 1
  
  2 2 2 2019-01-01 12:00:01 1
- 含义
  - resource：代表资源
  - status:锁定状态
  - expire:过期时间,根据需求看是否需要增加使用
- 执行流程：
  1. 执行查询操作获取当前数据的数据版本号,例如：select id, resource, state,version from table where state=1 and id=1;
  2. 执行更新：update table set state=2, version=上次+1 where resource=1 and state=1 and version=1
  3. 上述执行影响1行，加锁成功，影响0行，自己加锁失败，其它人已经加锁锁定

id	resource	status	expire	version
1	1	2	2019-01-01 12:00:00	1
2	2	2	2019-01-01 12:00:01	1

tair

Tair没有直接提供分布式锁的api，但是可以借助提供的其他api实现分布式锁。

incr/decr(不可重入锁)
- 原理：通过计数api的上下限值约束来实现(增加/减少计数。可设置最大值和最小值)
- api:
  1. 增加计数（加锁）：
    Result<Integer> incr(int namespace, Serializable key, int value, int defaultValue, int expireTime, int lowBound, int upperBound)
  2. 减少计数（释放锁）：
```
Result<Integer> decr(int namespace, Serializable key, int value, int defaultValue, int expireTime, int lowBound, int upperBound)  
```
  1. 关键参数解释：
  defaultValue: 第一次调用incr时的key的count初始值，第一次返回的值为defaultValue + value, decr第一次返回defaultValue - value lowBound: 最小值 upperBound: 最大值
使用
1. 线程一调用incr加锁,加锁后，key的值变成1，而key的上限值为1，其他线程再调用该接口时会报错COUNTER_OUT_OF_RANGE
2. 待线程一使用完成后，调用decr解锁,此时key已经有值1，返回 1-1=0，解锁成功。多次调用会失败，因为范围是0~1。
3. 通过0、1的来回变化，达到分布式锁的目的，当key为1时获取到锁，为0时释放锁

Get/Put

原理：使用put的version校验实现

api

ResultCode put(int namespace, Serializable key, Serializable value, int version, int expireTime)`

一定要设置过期参数expireTime，否则锁执行过程中进程crash，锁不会释放，会长期占有，影响业务，加上后，业务至少可以自行恢复

关键参数解释：

  version - 为了解决并发更新同一个数据而设置的参数。当version为0时，表示强制更新
  这里注意：
  此处version，除了0、1外的任何数字都可以，传入0，tair会强制覆盖；而传入1，第一个client写入会成功，但是新写入时服务端的version以0开始计数啊，所以此时version也是1，所以下一个到来的client写入也会成功，这样造成了冲突。

实现

这里针对网络等问题做了重试，同时改造支持可重入锁，不可重入锁，目前这里可重入没有做计数以及重新设置过期时间，使用的各位可以根据实际情况进行改造

   @Override
  public boolean tryLock(String lockKey, int expireTime, boolean reentrant) {
      if (expireTime <= 0) {
          expireTime = DEFAULT_EXPIRE_TIME;
      }
      int retryGet = 0;
      try {
          Result<DataEntry> result = tairManager.get(NAMESPACE, lockKey);
          while (retryGet++ < LOCK_GET_MAX_RETRY && result != null && isError(result.getRc())) {
              result = tairManager.get(NAMESPACE, lockKey);
          }
          if (result == null) {
              log.error("tryLock error, maybe Tair service is unavailable");
              return false;
          }
          if (ResultCode.DATANOTEXSITS.equals(result.getRc())) {
              // version 2表示为空，若不是为空，则返回version error
              ResultCode code = tairManager.put(NAMESPACE, lockKey, getLockValue(), DEFAULT_VERSION, expireTime);
              if (ResultCode.SUCCESS.equals(code)) {
                  return true;
              } else if (retryPut.get() < LOCK_PUT_MAX_RETRY && isError(code)) {
                  retryPut.set(retryPut.get() + 1);
                  return tryLock(lockKey, expireTime);
              }
          } else if (reentrant && result.getValue() != null && getLockValue().equals(result.getValue().getValue())) {
              return true;
          }
      } catch (Exception e) {
          log.error("try lock is error, msg is {}", e);
      } finally {
          retryPut.remove();
      }
      return false;
  }

  @Override
  public void unlock(String lockKey) {
      unlock(lockKey, false);
  }

  @Override
  public boolean unlock(String lockKey, boolean reentrant) {
      if (!reentrant) {
          ResultCode invalid = tairManager.invalid(NAMESPACE, lockKey);
          return invalid != null && invalid.isSuccess();
      }
      Result<DataEntry> result = tairManager.get(NAMESPACE, lockKey);
      if (result != null && result.isSuccess() && result.getValue() != null) {
          String value = result.getValue().getValue().toString();
          if (getLockValue().equals(value)) {
              ResultCode rc = tairManager.invalid(NAMESPACE, lockKey);
              if (rc != null && rc.isSuccess()) {
                  return true;
              } else {
                  log.error("unlock failed, tairLockManager.invalidValue fail, key is {}, ResultCode is {}",
                      lockKey, rc);
                  return false;
              }
          } else {
              log.warn("unlock failed,value is not equal lockValue, key is {}, lockValue is {}, value is {}",
                  lockKey, getLockValue(), value);
              return false;
          }
      }
      return false;
  }

  @Override
  public boolean lockStatus(String lockKey) {
      Result<DataEntry> result = tairManager.get(NAMESPACE, lockKey);
      if (result != null && result.isSuccess() && result.getValue() != null) {
          return true;
      }
      return false;
  }

  private boolean isError(ResultCode code) {
      return code == null || ResultCode.CONNERROR.equals(code) || ResultCode.TIMEOUT.equals(code) || ResultCode.UNKNOW
          .equals(code);
  }

  private String getLockValue() {
      return NetUtils.getLocalIp() + "_" + Thread.currentThread().getName();
  }

redis

正确的加锁逻辑
- API：
  1. 加锁
    SET key value [EX seconds] [PX milliseconds] [NX|XX]
  2. 释放锁
    EVAL script numkeys key [key ...] arg [arg ...]
- 关键参数解释
  
  加锁
  
```
EX second ：设置键的过期时间为 second 秒。 SET key value EX second 效果等同于 SETEX key second value
PX millisecond ：设置键的过期时间为 millisecond 毫秒。SET key value PX millisecond 效果等同于 PSETEX key millisecond value
NX ：只在键不存在时，才对键进行设置操作。 SET key value NX 效果等同于 SETNX key value
XX ：只在键已经存在时，才对键进行设置操作。
```
  >释放
```
script 参数是一段 Lua 5.1 脚本程序，它会被运行在 Redis 服务器上下文中，这段脚本不必(也不应该)定义为一个 Lua 函数。
numkeys 参数用于指定键名参数的个数。
键名参数 key [key ...] 从 EVAL 的第三个参数开始算起，表示在脚本中所用到的那些 Redis 键(key)，这些键名参数可以在 Lua 中通过全局变量 KEYS 数组，用 1 为基址的形式访问( KEYS[1] ， KEYS[2] ，以此类推)。
在命令的最后，那些不是键名参数的附加参数 arg [arg ...] ，可以在 Lua 中通过全局变量 ARGV 数组访问，访问的形式和 KEYS 变量类似( ARGV[1] 、 ARGV[2] ，诸如此类)。
- 实现
```
/**
*1. 当前没有锁（key不存在），那么就进行加锁操作，并对锁设置个有效期，同时value表示加锁的客户端。2. 已有锁存在，不做任何操作
**/
public boolean tryLock(String lockKey, String requestId, int expireTime) {

      String result = jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime);

      if (LOCK_SUCCESS.equals(result)) {
          return true;
      }
      return false;

  }
  
  public boolean unlock(String lockKey, String requestId) {

      String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
      Object result = jedis.eval(script, Collections.singletonList(lockKey), Collections.singletonList(requestId));

      if (RELEASE_SUCCESS.equals(result)) {
          return true;
      }
      return false;
} 
```
  - 首先，set()加入了NX参数，可以保证如果key已存在，则函数不会调用成功，即只有一个客户端能持有锁。其次，由于我们对锁设置了过期时间，即使锁的持有者后续发生crash而没有解锁，锁也会因为到了过期时间而自动解锁（即key被删除），不会发生死锁。最后，因为我们将value赋值为requestId，代表加锁的客户端请求标识，那么在客户端在解锁的时候就可以进行校验是否是同一个客户端。
  - 释放锁，这段Lua代码的功能：首先获取锁对应的value值，检查是否与requestId相等，如果相等则删除锁（解锁）。那么为什么要使用Lua语言来实现呢？因为lua可以确保上述操作是原子性的。

tair的rdb引擎目前不支持上述命令，所以需要写成两行命令（或许新版本支持了，因为我使用的的还是旧版本,所以rdb的实现方式：

支持可重入锁，不可重入锁，目前这里可重入没有做计数以及重新设置过期时间，使用的各位可以根据实际情况进行改造

/**
     * rdb 不支持多参数，所以使用两个命令
     *
     * @param lockKey
     * @param expireTime 超时时间
     * @param reentrant  是否可重入,重入后会延长时间
     * @return
     */
    @Override
    public boolean tryLock(String lockKey, int expireTime, boolean reentrant) {
        if (expireTime <= 0) {
            expireTime = DEFAULT_EXPIRE_TIME;
        }
        boolean result = redisRepo.setNx(lockKey, getLockValue(), expireTime);
        if (!reentrant) {
            return result;
        }
        String value = redisRepo.get(lockKey);
        if (getLockValue().equals(value)) {
            result = redisRepo.setNx(lockKey, getLockValue(), expireTime);
        }
        return result;
    }

    /**
     * 版本不支持lua，所以使用两个命令
     *
     * @param lockKey
     * @param reentrant 是否可以释放其它人创建的锁
     * @return
     */
    @Override
    public boolean unlock(String lockKey, boolean reentrant) {
        if (!reentrant) {
            return redisRepo.delKeys(lockKey) > 0;
        }
        long result = 0;
        String value = redisRepo.get(lockKey);
        if (getLockValue().equals(value)) {
            result = redisRepo.delKeys(lockKey);
        }
        return result > 0;
    }

    @Override
    public boolean lockStatus(String lockKey) {
        String value = redisRepo.get(lockKey);
        return StringUtils.isNotBlank(value);
    }

    private String getLockValue() {
        return NetUtils.getLocalIp() + "_" + Thread.currentThread().getName();
    }

错误的加锁示例

setnx()方法作用就是SET IF NOT EXIST，expire()方法就是给锁加一个过期时间。乍一看好像和前面的set()方法结果一样，但是由于这是两条Redis命令，不具有原子性，如果程序在执行完setnx()之后crash，由于锁没有设置过期时间，将会发生死锁
```
  public static void wrongGetLock1(Jedis jedis, String lockKey, String requestId, int expireTime) {
    Long result = jedis.setnx(lockKey, requestId);
    if (result == 1) {
        jedis.expire(lockKey, expireTime);
    }
 
}
```

通过setnx()方法尝试加锁，如果当前锁不存在，返回加锁成功。

如果锁存在则获取锁过期时间，和当前时间比较，如果锁已经过期，则设置新的过期时间，返回加锁成功

public static boolean wrongGetLock2(Jedis jedis, String lockKey, int expireTime) {

 long expires = System.currentTimeMillis() + expireTime;
 String expiresStr = String.valueOf(expires);

 if (jedis.setnx(lockKey, expiresStr) == 1) {
     return true;
 }

 String currentValueStr = jedis.get(lockKey);
 if (currentValueStr != null && Long.parseLong(currentValueStr) < System.currentTimeMillis()) {
     String oldValueStr = jedis.getSet(lockKey, expiresStr);
     if (oldValueStr != null && oldValueStr.equals(currentValueStr)) {
         return true;
     }
 }
 return false;

}


 上述代码问题出在哪里？
  * 由于是客户端自己生成过期时间，所以强制要求每个客户端的时间必须同步
  * 当锁过期的时候，如果多个客户端同时执行jedis.getSet()方法，那么虽然最终只有一个客户端可以加锁，但是这个客户端的锁的过期时间可能被其他客户端覆盖。
  * 锁不具备拥有者标识，即任何客户端都可以解锁（看个人业务）

错误的锁释放示例
1. 使用jedis.del()方法删除锁，这种不先判断锁的拥有者而直接解锁的方式，会导致任何客户端都可以随时进行解锁
```
public static void wrongReleaseLock1(Jedis jedis, String lockKey) {
jedis.del(lockKey);
}

```

2. 以下代码分成两条命令去执行，如果调用jedis.del()的时候，锁已经不属于当前客户端的时,会解除他人加的锁

```
public static void wrongReleaseLock2(Jedis jedis, String lockKey, String requestId) {

// 判断加锁与解锁是不是同一个客户端
if (requestId.equals(jedis.get(lockKey))) {
// 若在此时，这把锁过期不属于这个客户端的，则会误解锁
jedis.del(lockKey);
}
}
```

redis官方锁

Redis的官方曾提出了一个容错的分布式锁算法：RedLock，只要有超过一半的缓存服务器能够正常工作，系统就可以保证分布式锁的可用性。详情参考

zk

有机会或者留言需要的在写吧, 略略略
文章来源：https://www.cnblogs.com/guozp/p/10341337.html

方案比较（从低到高）

从理解的难易程度角度：数据库 > 缓存 > Zookeeper
从实现的复杂性角度：Zookeeper >= 缓存 > 数据库
从性能角度：缓存 > Zookeeper >= 数据库
从可靠性角度：Zookeeper > 缓存 > 数据库

posted @ 2019-01-31 14:33 mrguozp 阅读(1291) 评论(0) 收藏举报

刷新页面返回顶部

mrguozp

分布式锁

单机

分布式锁

常见方案

数据库(mysql)

tair

redis

redis官方锁

zk

方案比较（从低到高）

公告