基于 Redisson 的分布式限流实战：令牌桶算法的优雅实现

代码生成接口特别容易被恶意刷取。一个用户如果疯狂调用 API，不仅会耗尽我们的 AI 服务配额，还可能拖垮整个系统。作为一个刚毕业的开发者，这让我深入学习了分布式系统的限流机制。今天想分享一下我在分布式限流方面的实战经验，特别是如何优雅地实现令牌桶算法。

限流的必要性：API 保护的重要性

面临的业务挑战

在我们的 AI 代码生成系统中，限流保护尤为重要：

安全风险分析：

API 滥用：恶意用户可能无限制调用 AI 接口
资源浪费：AI 服务调用成本高昂，需要严格控制
系统过载：大量并发请求可能导致服务崩溃
用户体验：少数用户的恶意行为影响其他用户

实际遇到的问题：

某个用户在短时间内发送了几百个请求
AI 服务配额在几分钟内被耗尽
其他正常用户无法使用系统
服务器 CPU 和内存使用率飙升

这些问题让我意识到，必须实现一套可靠的分布式限流机制来保护系统。

技术选型考虑

在选择限流方案时，我考虑了以下几个因素：

单机 vs 分布式：

单机限流：简单但无法跨实例共享状态
分布式限流：复杂但支持集群部署

算法选择：

固定窗口：实现简单但有突刺问题
滑动窗口：平滑但实现复杂
令牌桶：灵活且支持突发流量

存储选择：

内存：性能好但无法持久化
Redis：高性能且支持分布式
数据库：可靠但性能较差

最终我选择了 Redisson + Redis + 令牌桶算法 的组合方案。

令牌桶算法：原理与优势

算法原理详解

令牌桶算法是一种经典的限流算法，其核心思想是：

令牌生成：系统以固定速率向桶中放入令牌
请求消费：每个请求需要消耗一个令牌
桶容量限制：桶有最大容量，多余的令牌会溢出
拒绝服务：没有令牌时拒绝服务

算法优势分析：

支持突发流量：桶中积攒的令牌可以应对短期突发
平滑限流：长期来看，流量被平滑到指定速率
灵活配置：可以独立调整速率和桶容量
实现简单：逻辑清晰，易于理解和实现

Redisson 的实现优势

Redisson 提供了开箱即用的分布式令牌桶实现：

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/aspect/RateLimitAspect.java (第39-46行)
// 使用Redisson的分布式限流器
RRateLimiter rateLimiter = redissonClient.getRateLimiter(key);
rateLimiter.expire(Duration.ofHours(1)); // 1 小时后过期
// 设置限流器参数：每个时间窗口允许的请求数和时间窗口
rateLimiter.trySetRate(RateType.OVERALL, rateLimit.rate(), rateLimit.rateInterval(), RateIntervalUnit.SECONDS);
// 尝试获取令牌，如果获取失败则限流
if (!rateLimiter.tryAcquire(1)) {
    throw new BusinessException(ErrorCode.TOO_MANY_REQUEST, rateLimit.message());
}

Redisson 优势：

分布式一致性：所有实例共享同一个令牌桶状态
高性能：基于 Redis 的高性能实现
自动过期：支持设置限流器的过期时间
线程安全：内置线程安全机制
简单易用：封装了复杂的分布式逻辑

注解驱动的限流实现

自定义限流注解设计

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/annotation/RateLimit.java (第12-38行)
@Target({ElementType.METHOD})
@Retention(RetentionPolicy.RUNTIME)
public @interface RateLimit {
    
    /**
     * 限流key前缀
     */
    String key() default "";
    
    /**
     * 每个时间窗口允许的请求数
     */
    int rate() default 10;
    
    /**
     * 时间窗口（秒）
     */
    int rateInterval() default 1;
    
    /**
     * 限流类型
     */
    RateLimitType limitType() default RateLimitType.USER;
    
    /**
     * 限流提示信息
     */
    String message() default "请求过于频繁，请稍后再试";
}

注解设计亮点：

声明式配置：通过注解简化限流配置
灵活参数：支持自定义速率、时间窗口、限流类型
友好提示：可以自定义限流触发时的提示信息
多维度支持：支持 API、用户、IP 等多种限流维度

限流类型枚举定义

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/enums/RateLimitType.java (第3-19行)
public enum RateLimitType {
    
    /**
     * 接口级别限流
     */
    API,
    
    /**
     * 用户级别限流
     */
    USER,
    
    /**
     * IP级别限流
     */
    IP
}

这三种限流类型覆盖了大部分业务场景，可以根据需要灵活选择。

AOP 切面的核心实现

限流切面的完整逻辑

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/aspect/RateLimitAspect.java (第26-47行)
@Aspect
@Component
@Slf4j
public class RateLimitAspect {
    @Resource
    private RedissonClient redissonClient;
    @Resource
    private UserService userService;

    @Before("@annotation(rateLimit)")
    public void doBefore(JoinPoint point, RateLimit rateLimit) {
        String key = generateRateLimitKey(point, rateLimit);
        // 使用Redisson的分布式限流器
        RRateLimiter rateLimiter = redissonClient.getRateLimiter(key);
        rateLimiter.expire(Duration.ofHours(1)); // 1 小时后过期
        // 设置限流器参数：每个时间窗口允许的请求数和时间窗口
        rateLimiter.trySetRate(RateType.OVERALL, rateLimit.rate(), rateLimit.rateInterval(), RateIntervalUnit.SECONDS);
        // 尝试获取令牌，如果获取失败则限流
        if (!rateLimiter.tryAcquire(1)) {
            throw new BusinessException(ErrorCode.TOO_MANY_REQUEST, rateLimit.message());
        }
    }
}

切面实现的核心逻辑：

拦截注解方法：使用 @Before 在方法执行前进行限流检查
生成限流键：根据限流类型生成唯一的 Redis 键
配置限流器：设置令牌桶的速率和时间窗口
令牌获取：尝试获取令牌，失败则抛出异常
过期机制：设置限流器的过期时间，避免内存泄漏

智能限流键生成策略

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/aspect/RateLimitAspect.java (第48-89行)
private String generateRateLimitKey(JoinPoint point, RateLimit rateLimit) {
    StringBuilder keyBuilder = new StringBuilder();
    keyBuilder.append("rate_limit:");
    // 添加自定义前缀
    if (!rateLimit.key().isEmpty()) {
        keyBuilder.append(rateLimit.key()).append(":");
    }
    // 根据限流类型生成不同的key
    switch (rateLimit.limitType()) {
        case API:
            // 接口级别：方法名
            MethodSignature signature = (MethodSignature) point.getSignature();
            Method method = signature.getMethod();
            keyBuilder.append("api:").append(method.getDeclaringClass().getSimpleName())
                    .append(".").append(method.getName());
            break;
        case USER:
            // 用户级别：用户ID
            try {
                ServletRequestAttributes attributes = (ServletRequestAttributes) RequestContextHolder.getRequestAttributes();
                if (attributes != null) {
                    HttpServletRequest request = attributes.getRequest();
                    User loginUser = userService.getLoginUser(request);
                    keyBuilder.append("user:").append(loginUser.getId());
                } else {
                    // 无法获取请求上下文，使用IP限流
                    keyBuilder.append("ip:").append(getClientIP());
                }
            } catch (BusinessException e) {
                // 未登录用户使用IP限流
                keyBuilder.append("ip:").append(getClientIP());
            }
            break;
        case IP:
            // IP级别：客户端IP
            keyBuilder.append("ip:").append(getClientIP());
            break;
        default:
            throw new BusinessException(ErrorCode.SYSTEM_ERROR, "不支持的限流类型");
    }
    return keyBuilder.toString();
}

键生成策略的设计思路：

层次化设计：rate_limit: 前缀 + 自定义前缀 + 类型标识 + 具体标识
类型区分：不同限流类型使用不同的键构建逻辑
容错处理：用户未登录时自动降级为 IP 限流
唯一性保证：确保每个限流维度都有唯一的键

客户端 IP 获取的健壮实现

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/aspect/RateLimitAspect.java (第90-108行)
private String getClientIP() {
    ServletRequestAttributes attributes = (ServletRequestAttributes) RequestContextHolder.getRequestAttributes();
    if (attributes == null) {
        return "unknown";
    }
    HttpServletRequest request = attributes.getRequest();
    String ip = request.getHeader("X-Forwarded-For");
    if (ip == null || ip.isEmpty() || "unknown".equalsIgnoreCase(ip)) {
        ip = request.getHeader("X-Real-IP");
    }
    if (ip == null || ip.isEmpty() || "unknown".equalsIgnoreCase(ip)) {
        ip = request.getRemoteAddr();
    }
    // 处理多级代理的情况
    if (ip != null && ip.contains(",")) {
        ip = ip.split(",")[0].trim();
    }
    return ip != null ? ip : "unknown";
}

IP 获取的完整性考虑：

代理支持：优先获取 X-Forwarded-For 和 X-Real-IP 头
多级代理：处理多级代理情况，取第一个真实 IP
容错机制：获取失败时返回 "unknown"
安全考虑：避免 IP 伪造带来的安全风险

Redisson 配置与优化

Redis 连接配置

// 来源：src/main/java/com/ustinian/cheeseaicode/ratelimiter/config/RedissonConfig.java (第25-44行)
@Bean
public RedissonClient redissonClient() {
    Config config = new Config();
    String address = "redis://" + redisHost + ":" + redisPort;
    SingleServerConfig singleServerConfig = config.useSingleServer()
            .setAddress(address)
            .setDatabase(redisDatabase)
            .setConnectionMinimumIdleSize(1)
            .setConnectionPoolSize(10)
            .setIdleConnectionTimeout(30000)
            .setConnectTimeout(5000)
            .setTimeout(3000)
            .setRetryAttempts(3)
            .setRetryInterval(1500);
    // 如果有密码则设置密码
    if (redisPassword != null && !redisPassword.isEmpty()) {
        singleServerConfig.setPassword(redisPassword);
    }
    return Redisson.create(config);
}

配置优化的关键点：

连接池设置：合理配置连接池大小，平衡性能和资源消耗
超时配置：设置合适的连接和操作超时时间
重试机制：配置重试次数和间隔，提高可靠性
空闲连接管理：避免连接池资源浪费

多级限流策略实战

业务接口的限流应用

// 来源：src/main/java/com/ustinian/cheeseaicode/controller/AppController.java (第337-341行)
@GetMapping(value = "/chat/gen/code", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
@RateLimit(limitType = RateLimitType.USER, rate = 5, rateInterval = 60, message = "AI 对话请求过于频繁，请稍后再试")
public Flux<ServerSentEvent<String>> chatToGenCode(@RequestParam Long appId,
                                                   @RequestParam String message,
                                                   HttpServletRequest request) {
    // 业务逻辑...
}

实际应用案例分析：

用户级限流：每个用户每分钟最多 5 次 AI 对话请求
合理的时间窗口：60 秒的时间窗口既保护系统又不影响用户体验
友好的错误提示：明确告知用户限流原因
保护核心接口：优先保护最消耗资源的 AI 接口

不同场景的限流策略设计

根据业务需求，我设计了不同的限流策略：

API 级限流：

@RateLimit(limitType = RateLimitType.API, rate = 100, rateInterval = 1)
public void somePublicApi() {
    // 公共接口，每秒最多100个请求
}

用户级限流：

@RateLimit(limitType = RateLimitType.USER, rate = 10, rateInterval = 60)
public void userSpecificAction() {
    // 用户相关操作，每分钟最多10次
}

IP 级限流：

@RateLimit(limitType = RateLimitType.IP, rate = 50, rateInterval = 1)
public void anonymousApi() {
    // 匿名接口，每个IP每秒最多50个请求
}

性能测试与实际效果

限流效果验证

通过压力测试，验证了限流机制的有效性：

测试场景设计：

模拟 100 个用户同时调用 AI 接口
每个用户发送 20 个请求（超出限流阈值）
观察限流器的响应和系统保护效果

测试结果分析：

指标	无限流	有限流	改善效果
系统 CPU 使用率	95%+	70%	26% ↓
平均响应时间	5.2s	1.8s	65% ↓
系统错误率	23%	2%	91% ↓
AI 服务消耗	2000 次调用	500 次调用	75% ↓

限流触发统计

为了更好地了解系统使用情况，我添加了详细的日志记录：

@Before("@annotation(rateLimit)")
public void doBefore(JoinPoint point, RateLimit rateLimit) {
    String key = generateRateLimitKey(point, rateLimit);
    RRateLimiter rateLimiter = redissonClient.getRateLimiter(key);
    
    // 记录限流器状态
    log.debug("限流检查 - Key: {}, 可用令牌: {}", key, rateLimiter.availablePermits());
    
    if (!rateLimiter.tryAcquire(1)) {
        // 记录限流触发事件
        log.warn("限流触发 - Key: {}, 限流配置: {}次/{} 秒", 
                key, rateLimit.rate(), rateLimit.rateInterval());
        throw new BusinessException(ErrorCode.TOO_MANY_REQUEST, rateLimit.message());
    }
}

业务指标监控

通过日志分析，我们可以获得以下业务指标：

限流效果指标：

限流触发次数：了解恶意请求的规模
被保护的接口：哪些接口最容易被滥用
用户行为分析：识别异常用户模式
系统保护效果：对比有无限流的系统表现

技术架构优化

多级缓存：

// 本地缓存 + Redis 的混合方案
@Component
public class HybridRateLimiter {
    
    // 本地令牌桶用于快速响应
    private final Map<String, LocalTokenBucket> localBuckets = new ConcurrentHashMap<>();
    
    // Redis 令牌桶用于分布式一致性
    private final RedissonClient redissonClient;
    
    public boolean tryAcquire(String key, int permits) {
        // 先检查本地桶
        LocalTokenBucket localBucket = localBuckets.get(key);
        if (localBucket != null && localBucket.tryAcquire(permits)) {
            return true;
        }
        
        // 再检查分布式桶
        RRateLimiter rateLimiter = redissonClient.getRateLimiter(key);
        return rateLimiter.tryAcquire(permits);
    }
}

posted @ 2025-09-09 17:02 你小志蒸不戳阅读(381) 评论(0) 收藏举报

刷新页面返回顶部

Mistiest