redis 获取连接池连接不上问题

问题详情：

redis.clients.jedis.exceptions.JedisConnectionException: Could not get a resource from the pool>
2017-12-21 13:50:58,192 WARN [com.inspeeding.StoreUploadFileToInThread] Thread-8 - <start again.....>
redis.clients.jedis.exceptions.JedisConnectionException: Could not get a resource from the pool
        at redis.clients.util.Pool.getResource(Pool.java:50)
        at redis.clients.jedis.JedisSentinelPool.getResource(JedisSentinelPool.java:181)
        at com.inspeeding.util.IntranetRedisUtil2.rpop(IntranetRedisUtil2.java:262)
        at com.inspeeding.StoreUploadFileToInThread.server(StoreUploadFileToInThread.java:83)
        at com.inspeeding.StoreUploadFileToInThread.run(StoreUploadFileToInThread.java:67)
Caused by: java.util.NoSuchElementException: Unable to validate object
        at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:502)
        at org.apache.commons.pool2.impl.GenericObjectPool.borrowObject(GenericObjectPool.java:361)
        at redis.clients.util.Pool.getResource(Pool.java:48)
        ... 4 more

问题原因分析：

redis是我们数据的保管者，我们可以随时存随时取，大的小的，重要的不重要的，它都毫无怨言的帮我们保存着，甚至有些时候，我们变得很懒，存东西进去的时候顺便还贴张纸：“过了一个星期就帮我扔了吧”，对于这些，Redis也都默默的接受了(谁叫Antirez把redis设计的这么好呢)。

这次要写的就是关于这张留言纸的事。

Redis提供了一套“美好”的过期数据清理机制:
主动过期: Redis对数据是惰性过期，当一个key到了过期时间，Redis也不会马上清理，但如果这个key过期后被再次访问，Redis就会主动将它清理掉。
被动过期: 如果过期的Key一直没被访问，Redis也不会一直把它放那不管，它会每秒10次的执行以下的清理工作：
        随机从所有带有过期时间的Key里取出20个
        如果发现有过期的，就清理
        如果这里有25%的Key都是过期的，就继续回到第一步再来一次

这套过期机制设计的很赞，可以这样理解：如果当前有超过1/4的Key是过期的话，就不停地清理，直到只剩下1/4不到的Key是要过期的为止，然后就慢慢地随机抽查着清理。

这个错误是因为JedisPool拿到一个连接后，调用 jedis.ping() 方法没有得到正确的返回”pong”消息，而出现这个问题时，并不是traffic的高峰期，redis的cpu不高，于是程序员很快就怀疑到网络上，难道有”丢包”?

但跑了几天，发现出错的时间固定在某几个时间点(如晚上9点~10点)，莫非是扫地阿姨每天定时在机房打扫卫生，碰着网线了？(有时候不得不佩服程序员的想象力)

然而在一个夜黑风高的晚上，程序员的脑子在这个时候一般是最清醒的，这时告警短信又来了，打开redis监控，像在唯品会上逛街一样，对着redis的各项监控数据逛啊逛，突然，看到有几条Expires的数据，当时的表情只能用看到关注了几天的商品上标了大大”0.1折”时的表情来形容。

接下来的事情，想必大家也都猜到个七七八八了，当然是下单抢购支付了，
脑子里一系列的运算，掐指一算: “这个时间点正好有一大批key过期”，而且都是大的Set集合，每个都有几十万的数据，再一算: “Redis里的大部分需要过期的key就是这些key”。

于是，答案有了，Redis进行被动过期清理时，发现怎么随机，都有超过1/4的Key都是过期的，就忙着不停的删啊删，再加上又都是大集合的删除，O(N)的操作复杂度，无奈，
等redis删完时，客户端那边的命令都等超时了。

原因找到了，如何解决？看业务场景吧，对于我们的场景，
做法是将过期时间设长一点，然后把这些可以删掉的Key标记一下，丢到一个后台线程那里分页删Set里的数据，这样就算redis再做过期操作，也不会用太多的时间来删除。

最后，稍稍总结下，对于大个的集合对象，放redis的时候需要额外注意，如果想依赖redis的过期，可能会造成过期时短暂的redis block。

所以，要善待redis数据，比如不用了就自己清理掉，不要等着redis来帮你

解决办法:

解决办法:
1:
登录redis :
redis-cli
127.0.0.1:6379>config set stop-writes-on-bgsave-error no

2:使用redis-cli修改rdb目录
CONFIG SET dir /tmp/redis_data
CONFIG SET dbfilename temp.rdb
重启redis-server，问题解决！但是需要每次启动server都要修改rdb的路径。

3:直接修改redis.conf文件

dir /tmp/redis_data #./ --> /tmp/redis_data
dbfilename temp.rdb #

启动redis服务

posted @ 2017-12-21 14:41 磕磕碰碰后才知道如何改变阅读(32230) 评论(2) 收藏举报

刷新页面返回顶部

磕磕碰碰后才知道如何改变

redis 获取连接池连接不上问题

公告