收入写RAFT算法（一）Leader选举

Raft Leader 选举实现文档

1. 概述

1.1 目的

本文档详细说明了 LingRaft-Lite 模块中 Raft Leader 选举功能的实现，包括涉及的类、实现细节、测试方法等，便于开发者理解和复现。

1.2 功能范围

节点状态管理（Follower、Candidate、Leader）
选举超时检测
投票请求与响应处理
多数派选举机制
心跳维护 Leader 地位
网络分区处理

1.3 Raft 算法参考

本实现基于 Raft 论文（Diego Ongaro 和 John Ousterhout, 2014）的 Leader 选举部分，具体参考：

Section 5.1: Leader Election
Section 5.2: Leader Election - RequestVote RPC
Section 5.4.1: Election Safety Property

2. 核心概念

2.1 节点状态

Raft 节点有三种状态：

状态	说明	职责
FOLLOWER	从节点	响应 Leader 的 RPC 请求（AppendEntries、RequestVote）
CANDIDATE	候选节点	发起选举，向其他节点请求投票
LEADER	主节点	处理客户端请求，向 Follower 复制日志，发送心跳

2.2 任期 (Term)

定义：

时间被分成多个任期，每个任期以选举开始
任期号是单调递增的整数
每次选举都进入新任期

用途：

识别过时的信息（旧任期的投票、心跳等）
防止脑裂（分裂投票）

实现：

private volatile long currentTerm = 0;  // 当前任期号

2.3 选举超时 (Election Timeout)

定义：

Follower 在收到有效心跳或投票请求之前等待的时间
超时后转为 Candidate 并发起选举

随机化：

为了避免多个节点同时超时导致平票选举，超时时间随机化
通常在 150ms ~ 300ms 之间

实现：

// 配置随机范围
config.setElectionTimeoutRandomRange(Range.of(150, 300));

// 计算随机超时时间
int randomTimeout = raftConfig.getElectionTimeoutMs();

2.4 多数派 (Majority)

定义：

超过半数的节点数：N/2 + 1
3 节点集群需要 2 票
5 节点集群需要 3 票

重要性：

保证选举结果的唯一性
两个多数派必然有交集，确保只有一个 Leader

实现：

public VoteCounter(long term, int totalNodes) {
    this.majorityCount = totalNodes / 2 + 1;
}

2.5 投票规则

节点投票给候选人的条件：

候选人的任期 >= 当前任期
如果任期相同，candidate 的日志至少和当前节点一样新

日志比较规则：

如果 candidateLastLogTerm > lastLogTerm，投票
如果 candidateLastLogTerm == lastLogTerm 且 candidateLastLogIndex >= lastLogIndex，投票
否则，拒绝投票

3. 涉及的类及其职责

3.1 核心类

类名	路径	职责
RaftNodeImpl	`com.ling.raft.core.RaftNodeImpl`	节点状态管理、选举发起、投票处理、心跳发送
ConsensusModuleImpl	`com.ling.raft.core.ConsensusModuleImpl`	投票请求和响应的具体实现逻辑
VoteCounter	`com.ling.raft.core.VoteCounter`	投票计数器，统计和判断多数派
ElectionTask	`com.ling.raft.core.task.ElectionTask`	选举超时检测任务
HeartbeatTask	`com.ling.raft.core.task.HeartbeatTask`	Leader 心跳发送任务
ServerStatusEnum	`com.ling.raft.enums.ServerStatusEnum`	节点状态枚举
VoteRequest	`com.ling.raft.model.dto.VoteRequest`	投票请求 RPC
VoteResponse	`com.ling.raft.model.dto.VoteResponse`	投票响应 RPC
ThreeNodeElectionTest	`com.ling.raft.example.leader.ThreeNodeElectionTest`	完整测试程序

3.2 类关系图

┌─────────────────────┐
│   RaftNodeImpl      │
│   (节点主类)         │
└──────────┬──────────┘
           │ 持有引用
           ├─────────────────┐
           ▼                 ▼
┌─────────────────────┐  ┌─────────────────────┐
│ ConsensusModuleImpl │  │   VoteCounter       │
│ (投票逻辑)          │  │   (投票计数)         │
└─────────────────────┘  └─────────────────────┘
           │                     │
           ├─────────────────────┤
           ▼                     ▼
┌─────────────────────┐  ┌─────────────────────┐
│  ElectionTask       │  │  HeartbeatTask      │
│  (选举超时检测)      │  │  (心跳任务)         │
└─────────────────────┘  └─────────────────────┘

3.3 关键字段说明

RaftNodeImpl

// 节点状态
private volatile ServerStatusEnum nodeStatus = ServerStatusEnum.FOLLOWER;

// 持久化状态
private volatile long currentTerm = 0;           // 当前任期
private volatile String votedFor = null;         // 本轮任期投票给的候选人

// 选举相关
private ScheduledExecutorService electionExecutor;
private ScheduledFuture<?> electionFuture;
private VoteCounter currentVoteCounter;
private final Random random = new Random();

// 心跳相关
private ScheduledExecutorService heartbeatExecutor;
private ScheduledFuture<?> heartbeatFuture;

// 时间记录
private volatile long prevElectionTime = 0;      // 上次选举时间
private volatile long preHeartBeatTime = 0;      // 上次收到心跳时间

ConsensusModuleImpl

public final RaftNodeImpl node;  // 持有 RaftNodeImpl 的引用
public final ReentrantLock voteLock = new ReentrantLock();  // 投票锁
public final ReentrantLock appendEntriesLock = new ReentrantLock();  // 追加条目锁

VoteCounter

private final long term;                      // 当前选举任期
private final Set<String> votesReceived;      // 已投票的节点ID集合
private final int majorityCount;              // 需要获得的多数派票数
private volatile boolean votedForSelf;        // 是否已投票给自己

4. 实现细节

4.1 节点状态与转换

4.1.1 状态枚举

类名：ServerStatusEnum

定义：

public enum ServerStatusEnum {
    LEADER("LEADER", "主节点"),
    CANDIDATE("CANDIDATE", "候选节点"),
    FOLLOWER("FOLLOWER", "从节点");
}

4.1.2 状态转换图

         +-------------------------+
         |         初始化          |
         +-------------------------+
                    |
                    ▼
         +-------------------------+
         |      FOLLOWER          | <------------+
         |  (等待心跳或投票)        |              |
         +-------------------------+              |
                    |                             |
                    | 选举超时                     | 收到更高任期的
                    |                             | AppendEntries 或
                    ▼                             | RequestVote
         +-------------------------+              |
         |     CANDIDATE          |              |
         |  (发起选举)             |              |
         +-------------------------+              |
                    |                             |
                    | 获得多数派                  |
                    |                             |
                    ▼                             |
         +-------------------------+              |
         |      LEADER            | --------------+
         |  (处理客户端请求)        |  发现更高任期
         +-------------------------+

4.1.3 转为 Follower

方法：becomeFollower(newTerm)

实现位置：RaftNodeImpl.java:175-196

public void becomeFollower(long newTerm) {
    // 检查任期
    if (newTerm < currentTerm) {
        log.warn("Cannot become Follower with smaller term: {} < {}",
                 newTerm, currentTerm);
        return;
    }

    ServerStatusEnum oldStatus = nodeStatus;

    // 更新状态
    nodeStatus = ServerStatusEnum.FOLLOWER;
    currentTerm = newTerm;
    votedFor = null;  // 重置投票记录
    currentVoteCounter = null;  // 清空投票计数器

    // 停止心跳（如果之前是 Leader）
    cancelHeartbeatTimer();

    // 重置选举定时器
    resetElectionTimer();

    log.info("State changed: {} -> FOLLOWER, term: {}", oldStatus, currentTerm);
}

调用场景：

节点初始化
收到更高任期的 AppendEntries
收到更高任期的 RequestVote
Candidate 收到有效 AppendEntries

4.1.4 转为 Candidate

方法：becomeCandidate()

实现位置：RaftNodeImpl.java:201-216

public void becomeCandidate() {
    ServerStatusEnum oldStatus = nodeStatus;

    // 增加任期号（重要！）
    currentTerm++;
    nodeStatus = ServerStatusEnum.CANDIDATE;
    votedFor = currentNodeConfig.getServerId();  // 投票给自己

    log.info("State changed: {} -> CANDIDATE, new term: {}", oldStatus, currentTerm);

    // 重置选举定时器
    resetElectionTimer();

    // 发起投票请求
    startElection();
}

调用场景：

选举超时
作为 Candidate 重新发起选举（平票后）

4.1.5 转为 Leader

方法：becomeLeader()

实现位置：RaftNodeImpl.java:221-243

public void becomeLeader() {
    // 只有 Candidate 才能成为 Leader
    if (nodeStatus != ServerStatusEnum.CANDIDATE) {
        log.warn("Only CANDIDATE can become LEADER, current: {}", nodeStatus);
        return;
    }

    ServerStatusEnum oldStatus = nodeStatus;
    nodeStatus = ServerStatusEnum.LEADER;

    // 初始化 Leader 状态（nextIndex、matchIndex）
    initializeLeaderState();

    // 取消选举定时器（Leader 不需要选举）
    cancelElectionTimer();

    log.info("========================================");
    log.info("State changed: {} -> LEADER, term: {}", oldStatus, currentTerm);
    log.info("========================================");

    // 立即发送心跳并开始心跳定时器
    sendHeartbeats();
    startHeartbeatTimer();
}

调用场景：

Candidate 获得多数派投票
单机模式直接成为 Leader

4.2 选举超时机制

4.2.1 选举超时检测

类名：ElectionTask

实现位置：com.ling.raft.core.task.ElectionTask.java

核心逻辑：

@Override
public void run() {
    try {
        // Leader 不需要选举
        if (node.getNodeStatus() == ServerStatusEnum.LEADER) {
            log.debug("Current node is LEADER, skip election");
            return;
        }

        // 检查是否超时
        long currentTime = System.currentTimeMillis();
        int electionTimeoutMs = node.getRaftConfig().getElectionTimeoutMs();
        long timeElapsed = currentTime - node.getPrevElectionTime();

        if (timeElapsed < electionTimeoutMs) {
            // 未超时，重新设置定时器
            node.resetElectionTimer();
            return;
        }

        // 选举超时，开始新一轮选举
        log.info("========================================");
        log.info("ELECTION TIMEOUT DETECTED!");
        log.info("Time elapsed: {}ms, Timeout: {}ms", timeElapsed, electionTimeoutMs);
        log.info("Current term: {}, Status: {}", node.getCurrentTerm(), node.getNodeStatus());
        log.info("Converting to CANDIDATE and starting new election...");
        log.info("========================================");

        node.becomeCandidate();

    } catch (Exception e) {
        log.error("Error in election task", e);
        if (node.getIsRunning().get()) {
            node.resetElectionTimer();
        }
    }
}

特点：

跳过 Leader：Leader 不需要选举
严格超时检查：确保真的超时才发起选举
日志详细：记录选举超时的关键信息

4.2.2 选举定时器管理

方法：resetElectionTimer()

实现位置：RaftNodeImpl.java:455-475

public void resetElectionTimer() {
    if (!isRunning.get()) {
        return;
    }

    // 取消旧的定时任务
    cancelElectionTimer();

    // 计算随机超时时间
    int randomTimeout = raftConfig.getElectionTimeoutMs();

    // 更新超时时间戳
    prevElectionTime = System.currentTimeMillis();

    // 设置新的定时任务
    electionFuture = electionExecutor.schedule(
        new ElectionTask(this),
        randomTimeout,
        TimeUnit.MILLISECONDS
    );

    log.debug("Election timer reset, timeout: {}ms", randomTimeout);
}

调用时机：

节点初始化为 Follower
收到有效心跳
收到投票请求（即使拒绝）
转为 Follower（从任何状态）
转为 Candidate（重新开始计时）

4.2.3 超时时间随机化

配置方式：

RaftConfig config = new RaftConfig(currentNode, allNodes);
config.setElectionTimeout(2);  // 基础倍数
config.setElectionTimeoutRandomRange(Range.of(150, 300));  // 随机范围

实现原理：

// RaftConfig 内部实现
public int getElectionTimeoutMs() {
    if (electionTimeoutRandomRange == null) {
        return electionTimeout * 1000;
    }

    // 在随机范围内选择一个值
    int min = electionTimeoutRandomRange.getMin();
    int max = electionTimeoutRandomRange.getMax();
    Random random = new Random();
    return min + random.nextInt(max - min + 1);
}

避免平票的原理：

3 个节点超时时间分别为：170ms、220ms、280ms
node1 先超时发起选举
node2 和 node3 收到投票请求后重置超时时间
node1 获得多数派（自己的票），成为 Leader

4.3 投票请求处理

4.3.1 RequestVote RPC

请求格式：VoteRequest

字段说明：

public class VoteRequest {
    private long term;          // candidate 的任期号
    private String candidateId; // candidate 的节点 ID
    private long lastLogIndex;  // candidate 最后一条日志的索引
    private long lastLogTerm;   // candidate 最后一条日志的任期号
}

响应格式：VoteResponse

字段说明：

public class VoteResponse {
    private long term;          // 当前任期（用于更新 candidate 的任期）
    private boolean voteGranted; // 是否投票
}

4.3.2 投票逻辑

方法：requestVote(VoteRequest voteRequest)

实现位置：ConsensusModuleImpl.java:45-90

@Override
public VoteResponse requestVote(VoteRequest voteRequest) {
    voteLock.lock();
    try {
        long currentTerm = node.getCurrentTerm();
        String votedFor = node.getVotedFor();
        String candidateId = voteRequest.getCandidateId();

        log.info("Received vote request from candidate: {}, Term: {}, CurrentTerm: {}, VotedFor: {}",
                candidateId, voteRequest.getTerm(), currentTerm, votedFor);

        // 1. 任期检查
        if (voteRequest.getTerm() < currentTerm) {
            log.info("Rejected: candidate term {} < current term {}",
                    voteRequest.getTerm(), currentTerm);
            return new VoteResponse(currentTerm, false);
        }

        // 2. 任期更大，更新并转为 Follower
        if (voteRequest.getTerm() > currentTerm) {
            log.info("Higher term received: {} -> {}, becoming FOLLOWER",
                    currentTerm, voteRequest.getTerm());
            node.becomeFollower(voteRequest.getTerm());
            currentTerm = node.getCurrentTerm();
            votedFor = node.getVotedFor();
        }

        // 3. 检查是否已投票给其他人
        if (votedFor != null && !votedFor.equals(candidateId)) {
            log.info("Already voted for {}, rejecting {}", votedFor, candidateId);
            return new VoteResponse(currentTerm, false);
        }

        // 4. 检查日志是否至少一样新
        if (isLogUpToDate(voteRequest.getLastLogIndex(), voteRequest.getLastLogTerm())) {
            log.info("Voting for candidate: {}", candidateId);
            node.setVotedFor(candidateId);
            node.setPrevElectionTime(System.currentTimeMillis());  // 重置超时
            return new VoteResponse(currentTerm, true);
        } else {
            log.info("Candidate log not up to date");
            return new VoteResponse(currentTerm, false);
        }
    } finally {
        voteLock.unlock();
    }
}

投票规则详解：

任期检查
- candidate 的任期 < 当前任期 → 拒绝
任期更新
- candidate 的任期 > 当前任期 → 更新任期，转为 Follower
唯一投票
- 本轮任期已投票给其他人 → 拒绝
- 已投票给该 candidate → 接受（幂等性）
日志完整性
- candidate 的日志 >= 自己的日志 → 接受
- 否则 → 拒绝

4.3.3 日志比较逻辑

方法：isLogUpToDate(candidateLastLogIndex, candidateLastLogTerm)

实现位置：ConsensusModuleImpl.java:337-350

private boolean isLogUpToDate(long candidateLastLogIndex, long candidateLastLogTerm) {
    long lastLogTerm = getLastLogTerm();
    long lastLogIndex = getLastLogIndex();

    // 优先比较任期：candidate 的任期更大 → 更新
    if (candidateLastLogTerm > lastLogTerm) {
        return true;
    }

    // 任期相同，比较索引：candidate 的索引 >= 自己的索引 → 更新
    if (candidateLastLogTerm == lastLogTerm && candidateLastLogIndex >= lastLogIndex) {
        return true;
    }

    // 其他情况 → 不更新
    return false;
}

示例：

情况 1: candidate 任期更大
candidate: term=3, index=5
current:  term=2, index=5
→ 投票 (任期更大)

情况 2: 任期相同，索引更大或相等
candidate: term=2, index=5
current:  term=2, index=4
→ 投票 (索引更大)

情况 3: 任期相同，索引更小
candidate: term=2, index=4
current:  term=2, index=5
→ 不投票 (日志落后)

情况 4: 任期更小
candidate: term=1, index=10
current:  term=2, index=5
→ 不投票 (任期更小)

4.3.4 投票锁

目的：防止并发投票请求导致状态不一致

实现：

public final ReentrantLock voteLock = new ReentrantLock();

@Override
public VoteResponse requestVote(VoteRequest voteRequest) {
    voteLock.lock();
    try {
        // 投票逻辑
        ...
    } finally {
        voteLock.unlock();
    }
}

保护的资源：

currentTerm
votedFor
nodeStatus

4.4 选举发起流程

4.4.1 开始选举

方法：startElection()

实现位置：RaftNodeImpl.java:266-289

private void startElection() {
    int totalNodes = raftConfig.getRaftNodeConfigList().size();
    currentVoteCounter = new VoteCounter(currentTerm, totalNodes);

    // 投票给自己
    currentVoteCounter.voteForSelf(currentNodeConfig.getServerId());

    log.info("Starting election for term: {}, voted for self, votes: {}/{}",
            currentTerm, currentVoteCounter.getVoteCount(), currentVoteCounter.getMajorityCount());

    // 单机模式直接成为 Leader
    if (totalNodes == 1) {
        log.info("Single node mode, becoming leader immediately");
        becomeLeader();
        return;
    }

    // 发送投票请求给所有其他节点
    List<RaftNodeConfig> otherNodes = getOtherNodes();
    for (RaftNodeConfig nodeConfig : otherNodes) {
        electionExecutor.execute(() -> sendVoteRequest(nodeConfig));
    }

    // 检查是否已获得多数派（可能只有自己一票的情况）
    checkElectionResult();
}

流程：

创建投票计数器
投票给自己
单机模式直接成为 Leader
多机模式并发发送投票请求
检查选举结果

4.4.2 发送投票请求

方法：sendVoteRequest(targetNode)

实现位置：RaftNodeImpl.java:294-316

private void sendVoteRequest(RaftNodeConfig targetNode) {
    try {
        // 构建 VoteRequest
        VoteRequest request = VoteRequest.builder()
                .term(currentTerm)
                .candidateId(currentNodeConfig.getServerId())
                .lastLogIndex(getLastLogIndex())
                .lastLogTerm(getLastLogTerm())
                .build();
        request.setAddress(targetNode.getIp() + ":" + targetNode.getPort());
        request.setCmd(Request.REQUEST_VOTE);

        log.debug("Sending VoteRequest to {} for term {}", targetNode.getServerId(), currentTerm);

        // 发送 RPC 请求
        VoteResponse response = rpcClient.send(request, RPC_TIMEOUT_MS);

        // 处理响应
        if (response != null) {
            handleVoteResponse(response, targetNode.getServerId());
        }
    } catch (Exception e) {
        log.debug("Failed to send vote request to {}: {}", targetNode.getServerId(), e.getMessage());
    }
}

特点：

并发发送到所有其他节点
使用线程池异步发送
超时设置为 3000ms
失败不重试（等待下一次选举）

4.4.3 投票计数器

类名：VoteCounter

实现位置：com.ling.raft.core.VoteCounter.java

核心方法：

// 记录投票
public synchronized boolean recordVote(String nodeId) {
    return votesReceived.add(nodeId);
}

// 投票给自己
public synchronized void voteForSelf(String selfId) {
    if (!votedForSelf) {
        votesReceived.add(selfId);
        votedForSelf = true;
    }
}

// 检查是否获得多数派
public boolean hasMajority() {
    return votesReceived.size() >= majorityCount;
}

// 获取当前票数
public int getVoteCount() {
    return votesReceived.size();
}

数据结构：

使用 ConcurrentHashMap.newKeySet() 存储投票节点 ID
保证线程安全
自动去重（不会重复计票）

4.5 投票响应处理

4.5.1 处理投票响应

方法：handleVoteResponse(response, voterId)

实现位置：RaftNodeImpl.java:322-361

private void handleVoteResponse(VoteResponse response, String voterId) {
    // 使用同步块确保原子性
    synchronized (this) {
        // 如果不是 Candidate，忽略
        if (nodeStatus != ServerStatusEnum.CANDIDATE) {
            log.debug("Not a candidate anymore (status: {}), ignoring vote from {}",
                    nodeStatus, voterId);
            return;
        }

        // 如果收到更高任期，转为 Follower
        if (response.getTerm() > currentTerm) {
            log.info("Received higher term {} from {}, stepping down",
                    response.getTerm(), voterId);
            becomeFollower(response.getTerm());
            return;
        }

        // 忽略旧任期的响应
        if (response.getTerm() < currentTerm) {
            log.debug("Received stale vote response from {} for old term {}",
                    voterId, response.getTerm());
            return;
        }

        // 统计投票
        if (response.isVoteGranted()) {
            boolean isNewVote = currentVoteCounter.recordVote(voterId);
            if (isNewVote) {
                log.info("Received vote from {} for term {}, total votes: {}/{}",
                        voterId, currentTerm, currentVoteCounter.getVoteCount(),
                        currentVoteCounter.getMajorityCount());

                // 检查选举结果
                checkElectionResult();
            }
        } else {
            log.debug("Vote denied by {} for term {}", voterId, currentTerm);
        }
    }
}

处理逻辑：

状态检查
- 不再是 Candidate → 忽略
任期检查
- 响应任期 > 当前任期 → 发现更高任期，转为 Follower
- 响应任期 < 当前任期 → 忽略旧响应
投票统计
- 投票成功 → 记录投票，检查是否获得多数派
- 投票失败 → 记录日志

4.5.2 检查选举结果

方法：checkElectionResult()

实现位置：RaftNodeImpl.java:367-373

private void checkElectionResult() {
    if (currentVoteCounter != null && currentVoteCounter.hasMajority()) {
        log.info("Majority votes received ({}/{}), becoming LEADER",
                currentVoteCounter.getVoteCount(), currentVoteCounter.getMajorityCount());
        becomeLeader();
    }
}

调用时机：

投票给自己后（单机模式）
收到每个投票响应后
所有投票请求发送后（初始检查）

4.6 心跳机制

4.6.1 心跳任务

类名：HeartbeatTask

实现位置：com.ling.raft.core.task.HeartbeatTask.java

@Override
public void run() {
    try {
        // 只有 Leader 才发送心跳
        if (node.getNodeStatus() != ServerStatusEnum.LEADER) {
            log.debug("Current node is not LEADER, skip heartbeat");
            return;
        }

        log.debug("Sending heartbeats to all nodes, term: {}", node.getCurrentTerm());

        // 发送心跳给所有节点
        node.sendHeartbeats();

    } catch (Exception e) {
        log.error("Error in heartbeat task", e);
    }
}

4.6.2 发送心跳

方法：sendHeartbeats()

实现位置：RaftNodeImpl.java:407-413

public void sendHeartbeats() {
    List<RaftNodeConfig> otherNodes = getOtherNodes();

    for (RaftNodeConfig nodeConfig : otherNodes) {
        heartbeatExecutor.execute(() -> sendHeartbeat(nodeConfig));
    }
}

4.6.3 单次心跳发送

方法：sendHeartbeat(targetNode)

实现位置：RaftNodeImpl.java:418-436

private void sendHeartbeat(RaftNodeConfig targetNode) {
    try {
        // 构建心跳请求（entries 为空）
        AppendEntriesRequest request = AppendEntriesRequest.builder()
                .term(currentTerm)
                .leaderId(currentNodeConfig.getServerId())
                .entries(new ArrayList<>())  // 空列表表示心跳
                .build();
        request.setAddress(targetNode.getIp() + ":" + targetNode.getPort());
        request.setCmd(Request.APPEND_ENTRIES);

        // 发送请求
        AppendEntriesResponse response = rpcClient.send(request, RPC_TIMEOUT_MS);

        // 处理响应
        if (response != null) {
            handleHeartbeatResponse(response, targetNode.getServerId());
        }
    } catch (Exception e) {
        log.debug("Failed to send heartbeat to {}: {}", targetNode.getServerId(), e.getMessage());
    }
}

心跳特点：

entries 为空列表
只包含 term、leaderId 等元数据
用于维护 Leader 地位，防止 Follower 发起新选举

4.6.4 心跳定时器

方法：startHeartbeatTimer()

实现位置：RaftNodeImpl.java:380-391

private void startHeartbeatTimer() {
    int heartbeatInterval = raftConfig.getHeartbeatIntervalMs();

    heartbeatFuture = heartbeatExecutor.scheduleAtFixedRate(
            new HeartbeatTask(this),
            0,  // 立即开始
            heartbeatInterval,  // 间隔
            TimeUnit.MILLISECONDS
    );

    log.debug("Heartbeat timer started, interval: {}ms", heartbeatInterval);
}

配置示例：

config.setHeartbeatInterval(1);  // 每 1 秒发送一次心跳

4.6.5 心跳响应处理

方法：handleHeartbeatResponse(response, nodeId)

实现位置：RaftNodeImpl.java:441-448

private void handleHeartbeatResponse(AppendEntriesResponse response, String nodeId) {
    // 如果响应的任期更大，转为 Follower
    if (response.getTerm() > currentTerm) {
        log.info("Received higher term {} from {} in heartbeat response, stepping down",
                response.getTerm(), nodeId);
        becomeFollower(response.getTerm());
    }
}

处理逻辑：

检查响应中的任期
发现更高任期 → 立即转为 Follower
避免网络分区导致的脑裂

4.7 安全性保证

4.7.1 选举安全性

目标：任期内最多一个 Leader

实现：

任期单调递增

public void becomeCandidate() {
    currentTerm++;  // 每次选举增加任期
}

只投一次票

// ConsensusModuleImpl.requestVote()
if (votedFor != null && !votedFor.equals(candidateId)) {
    return new VoteResponse(currentTerm, false);
}

多数派约束

// VoteCounter
public boolean hasMajority() {
    return votesReceived.size() >= majorityCount;  // N/2 + 1
}

4.7.2 任期更新规则

规则：发现更高任期 → 更新任期，转为 Follower

实现位置：

ConsensusModuleImpl.requestVote() 第 63-68 行
ConsensusModuleImpl.appendEntries() 第 128-134 行
RaftNodeImpl.handleVoteResponse() 第 333-337 行
RaftNodeImpl.handleHeartbeatResponse() 第 443-447 行

示例：

// 在 requestVote 中
if (voteRequest.getTerm() > currentTerm) {
    node.becomeFollower(voteRequest.getTerm());
    currentTerm = node.getCurrentTerm();
}

4.7.3 日志完整性检查

目的：只投票给日志至少和自己一样新的候选人

实现：isLogUpToDate(candidateLastLogIndex, candidateLastLogTerm)

规则：

candidate 任期 > 自己任期 → 投票
任期相同，candidate 索引 >= 自己索引 → 投票
否则 → 拒绝

重要性：

保证新 Leader 包含所有已提交的日志
防止日志丢失或覆盖

4.7.4 脑裂预防

场景：网络分区，两个 Leader 同时存在

预防机制：

多数派约束
- Leader 需要多数派支持
- 分区后的少数派无法获得足够票数
心跳超时
- 少数派 Follower 收不到心跳
- 选举超时后发起选举
- 多数派选出新 Leader
任期递增
- 新 Leader 使用更高任期
- 旧 Leader 的心跳被拒绝

示例：

初始状态：5 节点（node1-5），Leader=node1

网络分区：
- 分区 A: node1, node2 (2 节点)
- 分区 B: node3, node4, node5 (3 节点)

分区 A:
- node1 仍是 Leader
- node2 收不到心跳，超时后转为 Candidate
- 只有 1 票（自己），无法获得多数派（需要 3 票）
- 无法选出新 Leader

分区 B:
- node3 超时后发起选举
- 获得自己 + node4 + node5 的票（3 票）
- 成为新 Leader（term=2）

网络恢复后：
- node1 发送心跳（term=1）
- 其他节点拒绝（term=2 > term=1）
- node1 收到更高任期，转为 Follower

5. 测试指南

5.1 测试程序

文件位置：

LingRaft-Lite-Core/LingRafte-Lite-CopyLog/src/main/java/com/ling/raft/example/leader/ThreeNodeElectionTest.java

运行方式：

# 直接运行 main 方法
java -cp <classpath> com.ling.raft.example.leader.ThreeNodeElectionTest

脚本运行：

cd LingRaft-Lite-Core/LingRafte-Lite-CopyLog/src/main/java/com/ling/raft/example/leader
start-cluster.bat

5.2 测试功能

5.2.1 基本测试场景

场景 1：正常选举

[STEP 1] Starting 3 nodes...
  ✓ node1 started on port 8081
  ✓ node2 started on port 8082
  ✓ node3 started on port 8083
  ✓ All nodes started!

[STEP 2] Waiting for leader election...
[Cluster] node1:C(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:L(t1) node2:F(t1) node3:F(t1)
----------------------------------------
  ✓ Leader elected!

场景 2：Leader 故障

raft> kill node1
✓ node1 stopped
! Leader killed, waiting for new election...
[Cluster] node1:F(t1) node2:C(t2) node3:F(t2)
[Cluster] node1:F(t2) node2:L(t2) node3:F(t2)

场景 3：节点恢复

raft> revive node1
✓ node1 revived
✓ Status: FOLLOWER
✓ Election timer: active
[Cluster] node1:F(t2) node2:L(t2) node3:F(t2)

5.2.2 交互式命令

命令	说明	示例
`status`	查看所有节点状态	`status`
`leader`	显示当前 Leader 信息	`leader`
`kill <node>`	模拟节点故障	`kill node1`
`revive <node>`	恢复节点	`revive node1`
`log <level>`	控制日志级别	`log debug`
`stop`	停止所有节点并退出	`stop`

5.2.3 日志级别控制

控制方式：

raft> log silent
✓ Log level set to ERROR (silent mode)

raft> log info
✓ Log level set to INFO

raft> log debug
✓ Log level set to DEBUG (verbose mode)

raft> log election
✓ Showing election logs only

raft> log heartbeat
✓ Showing heartbeat logs only

日志级别说明：

silent/error - 仅错误信息
warn - 警告及以上
info - 信息及以上（默认）
debug - 调试信息（全部日志）
election - 仅选举相关日志
heartbeat - 仅心跳相关日志

5.3 预期输出

正常选举

╔════════════════════════════════════════════════════════════╗
║          Raft Leader Election Test - 3 Nodes               ║
╚════════════════════════════════════════════════════════════╝

[STEP 1] Starting 3 nodes...
  ✓ node1 started on port 8081
  ✓ node2 started on port 8082
  ✓ node3 started on port 8083
  ✓ All nodes started!

[STEP 2] Waiting for leader election...
[Cluster] node1:F(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:C(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:L(t1) node2:F(t1) node3:F(t1)
----------------------------------------
  ✓ Leader elected!

┌────────────────────────────────────────────────────────────┐
│                     Cluster Status                         │
├────────────┬──────────────┬─────────┬─────────┬────────────┤
│ Node       │ Status       │ Term    │ Log     │ Voted For  │
├────────────┼──────────────┼─────────┼─────────┼────────────┤
│ node1      │ LEADER       │ 1       │ 0       │ -          │
│ node2      │ FOLLOWER     │ 1       │ 0       │ node1      │
│ node3      │ FOLLOWER     │ 1       │ 0       │ node1      │
└────────────┴──────────────┴─────────┴─────────┴────────────┘

Leader 故障恢复

raft> kill node1
Killing node1...
✓ node1 stopped
! Leader killed, waiting for new election...
[Cluster] node1:F(t1) node2:C(t2) node3:F(t2)
[Cluster] node1:F(t2) node2:L(t2) node3:F(t2)

raft> leader
┌────────────────────────────────────────────────────────────┐
│                      Leader Info                           │
├────────────────────────────────────────────────────────────┤
│  Node ID:   node2                                         │
│  Address:   127.0.0.1:8082                                 │
│  Term:      2                                              │
└────────────────────────────────────────────────────────────┘

raft> revive node1
Reviving node1...
✓ node1 revived
✓ Status: FOLLOWER
✓ Election timer: active
[Cluster] node1:F(t2) node2:L(t2) node3:F(t2)

5.4 完整测试流程

步骤 1：启动并验证选举

# 运行测试程序
java com.ling.raft.example.leader.ThreeNodeElectionTest

# 观察选举过程
[Cluster] node1:F(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:C(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:L(t1) node2:F(t1) node3:F(t1)

# 查看当前状态
raft> status

步骤 2：验证心跳

# 等待几秒，观察心跳
[Cluster] node1:L(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:L(t1) node2:F(t1) node3:F(t1)
[Cluster] node1:L(t1) node2:F(t1) node3:F(t1)

# 启用心跳日志观察
raft> log heartbeat
✓ Showing heartbeat logs only

步骤 3：模拟 Leader 故障

# 杀死 Leader
raft> kill node1
✓ node1 stopped
! Leader killed, waiting for new election...

# 观察新选举
[Cluster] node1:F(t1) node2:C(t2) node3:F(t2)
[Cluster] node1:F(t2) node2:L(t2) node3:F(t2)

步骤 4：恢复旧 Leader

# 恢复节点
raft> revive node1
✓ node1 revived

# 观察恢复过程
[Cluster] node1:F(t2) node2:L(t2) node3:F(t2)

步骤 5：多次故障测试

# 持续故障恢复
raft> kill node2
raft> kill node3
raft> revive node2
raft> revive node3

6. 使用示例

6.1 基本使用

// 1. 创建节点配置
RaftNodeConfig node1 = new RaftNodeConfig("node1", "127.0.0.1", 8081);
RaftNodeConfig node2 = new RaftNodeConfig("node2", "127.0.0.1", 8082);
RaftNodeConfig node3 = new RaftNodeConfig("node3", "127.0.0.1", 8083);
List<RaftNodeConfig> allNodes = Arrays.asList(node1, node2, node3);

// 2. 创建 Raft 配置
RaftConfig config1 = new RaftConfig(node1, allNodes);
config1.setElectionTimeout(2);  // 基础超时倍数
config1.setElectionTimeoutRandomRange(Range.of(150, 300));  // 随机范围
config1.setHeartbeatInterval(1);  // 心跳间隔 1 秒

// 3. 创建 RPC 组件
DefaultRpcServer rpcServer1 = new DefaultRpcServer(node1.getPort(), null);
DefaultRpcClient rpcClient1 = new DefaultRpcClient();

// 4. 创建并初始化 Raft 节点
RaftNodeImpl raftNode1 = new RaftNodeImpl(config1, rpcServer1, rpcClient1);
rpcServer1.setRaftNode(raftNode1);
raftNode1.init();

// 5. 等待选举
Thread.sleep(2000);

// 6. 检查节点状态
if (raftNode1.getNodeStatus() == ServerStatusEnum.LEADER) {
    System.out.println("Node1 is Leader, term: " + raftNode1.getCurrentTerm());
}

6.2 监控选举状态

// 创建监控线程
Thread monitor = new Thread(() -> {
    while (true) {
        System.out.printf("Node1: %s(t%d) ",
            raftNode1.getNodeStatus(),
            raftNode1.getCurrentTerm());

        System.out.printf("Node2: %s(t%d) ",
            raftNode2.getNodeStatus(),
            raftNode2.getCurrentTerm());

        System.out.printf("Node3: %s(t%d)\n",
            raftNode3.getNodeStatus(),
            raftNode3.getCurrentTerm());

        Thread.sleep(3000);
    }
});
monitor.setDaemon(true);
monitor.start();

6.3 手动触发选举

// 停止 Leader 的心跳定时器
raftNode1.cancelHeartbeatTimer();

// 模拟 Follower 超时
raftNode2.resetElectionTimer();  // 重置超时
// 等待超时后，node2 会自动发起选举

6.4 查询投票信息

// 获取当前投票信息
String votedFor = raftNode1.getVotedFor();
long currentTerm = raftNode1.getCurrentTerm();
ServerStatusEnum status = raftNode1.getNodeStatus();

System.out.println("Node1 - Status: " + status + ", Term: " + currentTerm + ", VotedFor: " + votedFor);

// 如果是 Candidate，查看投票计数器
if (status == ServerStatusEnum.CANDIDATE) {
    VoteCounter counter = raftNode1.getCurrentVoteCounter();
    System.out.println("Votes: " + counter.getVoteCount() + "/" + counter.getMajorityCount());
}

7. 常见问题

7.1 为什么选举超时需要随机化？

原因：

如果所有节点使用固定的超时时间，可能同时超时
同时超时的节点会同时发起选举
导致平票（split vote），需要重新选举
随机化可以避免多个节点同时超时

示例：

不随机化（3 个节点都使用 200ms）：
t=0ms: 所有节点启动
t=200ms: 3 个节点同时超时，都转为 Candidate
t=201ms: 3 个节点都发送投票请求
t=210ms: 每个节点只收到自己的票（1 票）
t=220ms: 选举超时，重新选举（平票）

随机化（3 个节点使用 150-300ms 随机）：
t=0ms: 所有节点启动
t=170ms: node1 超时，发起选举
t=171ms: node2 和 node3 收到投票请求，重置超时
t=220ms: node2 超时（新时间）
t=221ms: node1 已经是 Leader，node2 收到心跳，重置超时
t=280ms: node3 超时
t=281ms: node3 收到心跳，重置超时
t=1000ms: 心跳继续，node1 保持 Leader

代码实现：

// RaftConfig.java
public int getElectionTimeoutMs() {
    if (electionTimeoutRandomRange == null) {
        return electionTimeout * 1000;
    }

    int min = electionTimeoutRandomRange.getMin();
    int max = electionTimeoutRandomRange.getMax();
    Random random = new Random();
    return min + random.nextInt(max - min + 1);
}

7.2 为什么收到投票请求后要重置超时？

原因：

收到投票请求表示至少有一个其他节点是活跃的
重置超时可以减少不必要的选举
避免频繁切换状态

代码实现：

// RaftNodeImpl.java:498-500
@Override
public VoteResponse handleVoteRequest(VoteRequest voteRequest) {
    VoteResponse response = consensus.requestVote(voteRequest);

    // 如果投票给了对方，重置选举定时器
    if (response.isVoteGranted()) {
        resetElectionTimer();
    }

    return response;
}

7.3 为什么 Candidate 要增加任期？

原因：

避免使用旧任期发起新的选举
区分不同轮的选举
保证任期单调递增

代码实现：

// RaftNodeImpl.java:201-216
public void becomeCandidate() {
    ServerStatusEnum oldStatus = nodeStatus;

    // 增加任期号（重要！）
    currentTerm++;
    nodeStatus = ServerStatusEnum.CANDIDATE;
    votedFor = currentNodeConfig.getServerId();

    log.info("State changed: {} -> CANDIDATE, new term: {}", oldStatus, currentTerm);

    resetElectionTimer();
    startElection();
}

7.4 如何处理网络分区？

Raft 的保证：

旧 Leader 无法获得多数派，无法提交新日志
新 Leader 会在多数派分区选举产生
网络恢复后，旧 Leader 会转为 Follower

代码体现：

// 旧 Leader 的心跳被拒绝
private void handleHeartbeatResponse(AppendEntriesResponse response, String nodeId) {
    if (response.getTerm() > currentTerm) {
        log.info("Received higher term {}, stepping down", response.getTerm());
        becomeFollower(response.getTerm());
    }
}

// 旧 Leader 无法获得多数派
public boolean hasMajority() {
    return votesReceived.size() >= majorityCount;  // N/2 + 1
}

7.5 为什么心跳间隔通常远小于选举超时？

原因：

心跳间隔短（如 100ms），选举超时长（如 200-300ms）
确保 Follower 在超时前收到心跳
避免不必要的选举

配置示例：

config.setHeartbeatInterval(1);  // 1 秒（1000ms）
config.setElectionTimeoutRandomRange(Range.of(150, 300));  // 150-300ms

// 注意：这里心跳间隔是秒，超时是毫秒
// 实际使用时，心跳间隔应该 < 选举超时

建议配置：

心跳间隔：50ms - 100ms
选举超时：150ms - 300ms

7.6 如何避免平票（split vote）？

平票场景：

3 个节点：
- node1: term=2, votes=[node1]
- node2: term=2, votes=[node2]
- node3: term=2, votes=[node3]

每个节点只有 1 票，无法获得多数派（需要 2 票）
选举超时后重新选举

避免方法：

随机化超时（已实现）
- 减少多个节点同时超时的概率
预投票（Pre-vote）（未实现）
- 先询问其他节点是否愿意投票
- 如果多数派同意，再真正发起选举
快速重试（未实现）
- 平票后快速重新选举
- 立即开始，不等超时

当前实现：

仅依赖超时随机化
平票后等待超时重试

7.7 为什么单机模式直接成为 Leader？

原因：

单机集群不需要选举
只有一个节点，自己就是多数派
提高启动速度

代码实现：

// RaftNodeImpl.java:274-279
private void startElection() {
    int totalNodes = raftConfig.getRaftNodeConfigList().size();
    currentVoteCounter = new VoteCounter(currentTerm, totalNodes);
    currentVoteCounter.voteForSelf(currentNodeConfig.getServerId());

    // 单机模式直接成为 Leader
    if (totalNodes == 1) {
        log.info("Single node mode, becoming leader immediately");
        becomeLeader();
        return;
    }

    // 多机模式发送投票请求
    ...
}

7.8 如何调优选举参数？

参数建议：

参数	推荐值	说明
心跳间隔	50ms - 100ms	越短越快，但网络开销大
选举超时最小	150ms - 200ms	应该 > 心跳间隔
选举超时最大	300ms - 400ms	应该是心跳间隔的 3-5 倍
RPC 超时	2000ms - 3000ms	应该 > 选举超时

调优示例：

// 低延迟场景（数据中心内）
config.setHeartbeatInterval(1);      // 1ms
config.setElectionTimeoutRandomRange(Range.of(10, 20));  // 10-20ms

// 高稳定性场景（广域网）
config.setHeartbeatInterval(100);    // 100ms
config.setElectionTimeoutRandomRange(Range.of(500, 1000));  // 500-1000ms

// 开发调试场景
config.setHeartbeatInterval(1);      // 1秒
config.setElectionTimeoutRandomRange(Range.of(2000, 4000));  // 2-4秒

附录

A. 术语表

术语	说明
Term	任期号，单调递增，用于识别 Leader
Election Timeout	选举超时时间，随机化避免平票
Heartbeat	心跳，Leader 定期发送维持地位
Majority	多数派，超过半数的节点（N/2 + 1）
Split Vote	平票选举，没有节点获得多数派
Candidate	候选节点，发起选举的节点
Leader	主节点，处理客户端请求
Follower	从节点，响应 Leader 的请求

B. 参考资料

Raft 论文：Diego Ongaro, John Ousterhout. "In Search of an Understandable Consensus Algorithm." 2014
Raft GitHub：https://github.com/ongardie/raft.github.io
可视化 Raft：http://thesecretlivesofdata.com/raft/
Raft Scope：https://raft.github.io/raftscope/index.html

C. 相关文件

文件	路径
RaftNodeImpl	`com.ling.raft.core.RaftNodeImpl`
ConsensusModuleImpl	`com.ling.raft.core.ConsensusModuleImpl`
VoteCounter	`com.ling.raft.core.VoteCounter`
ElectionTask	`com.ling.raft.core.task.ElectionTask`
HeartbeatTask	`com.ling.raft.core.task.HeartbeatTask`
ServerStatusEnum	`com.ling.raft.enums.ServerStatusEnum`
VoteRequest	`com.ling.raft.model.dto.VoteRequest`
VoteResponse	`com.ling.raft.model.dto.VoteResponse`
ThreeNodeElectionTest	`com.ling.raft.example.leader.ThreeNodeElectionTest`

posted @ 2026-01-31 23:40 Hadwinling 阅读(40) 评论(0) 收藏举报

刷新页面返回顶部

CoffeeToCode

收入写RAFT算法（一）Leader选举

Raft Leader 选举实现文档

目录

1. 概述

1.1 目的

1.2 功能范围

1.3 Raft 算法参考

2. 核心概念

2.1 节点状态

2.2 任期 (Term)

2.3 选举超时 (Election Timeout)

2.4 多数派 (Majority)

2.5 投票规则

3. 涉及的类及其职责

3.1 核心类

3.2 类关系图

3.3 关键字段说明

RaftNodeImpl

ConsensusModuleImpl

VoteCounter

4. 实现细节

4.1 节点状态与转换

4.1.1 状态枚举

4.1.2 状态转换图

4.1.3 转为 Follower

4.1.4 转为 Candidate

4.1.5 转为 Leader

4.2 选举超时机制

4.2.1 选举超时检测

4.2.2 选举定时器管理

4.2.3 超时时间随机化

4.3 投票请求处理

4.3.1 RequestVote RPC

4.3.2 投票逻辑

4.3.3 日志比较逻辑

4.3.4 投票锁

4.4 选举发起流程

4.4.1 开始选举

4.4.2 发送投票请求

4.4.3 投票计数器

4.5 投票响应处理

4.5.1 处理投票响应

4.5.2 检查选举结果

4.6 心跳机制

4.6.1 心跳任务

4.6.2 发送心跳

4.6.3 单次心跳发送

4.6.4 心跳定时器

4.6.5 心跳响应处理

4.7 安全性保证

4.7.1 选举安全性

4.7.2 任期更新规则

4.7.3 日志完整性检查

4.7.4 脑裂预防

5. 测试指南

5.1 测试程序

5.2 测试功能

5.2.1 基本测试场景

5.2.2 交互式命令

5.2.3 日志级别控制

5.3 预期输出

正常选举

Leader 故障恢复

5.4 完整测试流程

步骤 1：启动并验证选举

步骤 2：验证心跳

步骤 3：模拟 Leader 故障

步骤 4：恢复旧 Leader

步骤 5：多次故障测试

6. 使用示例

6.1 基本使用

6.2 监控选举状态

6.3 手动触发选举

6.4 查询投票信息

7. 常见问题

7.1 为什么选举超时需要随机化？

7.2 为什么收到投票请求后要重置超时？

7.3 为什么 Candidate 要增加任期？

7.4 如何处理网络分区？