幂等的双倍快乐，你值得拥有

hello，这是有态度马甲的第xxx篇原创口水文。有趣指数5颗星，有用指数5颗星。

😠😠本文是国外技术网站medium上点赞超过200+的翻译/笔记文，有关规避/解决幂等请求的编程指南。

1. 软件领域二次请求无法避免

我们生活的每时每刻都是独一无二的，事情/动作可能不会相同的形式再次发生。

在软件领域，同一动作请求并不总会只产生一次，这可能会带来一些问题：想象你月底发薪，公司的转账指令错误的触发了2次，这岂不是双倍快乐。

为什么幂等性很重要？

网络不可靠：客户端超时后，可以放心地重试幂等的请求（如PUT, DELETE），而不用担心产生意外后果。
分布式系统：在微服务架构中，服务间的重试机制依赖于幂等性来保证数据一致性。

二次请求的来源	能避免出现吗？	怎么避免出现？
前端的频繁点击提交	能	提交后置灰按钮/提交后切换页面/防误触来解决
客户端/中间服务器的重试动作	不能	-

根据双将军理论，即使A/B将军不断确认收到对方的上一条信息，也没办法确保对方与自己达成(同一时间攻击的共识)。

两将军问题是无解的，间歇性重试是一种工程解。（还有散弹打鸟）

：我们一直发送相同的服务请求，直到我们确定收到它（虽然可能会多次收到），这就叫至少一次交付。

但是我们不希望被扣款两次，那我们就必须确保多次处理相同的请求不会改变最初的应用状态，这是幂等请求的重点。

除此之外，重试还可能带来重试风暴、资源雪崩等衍生问题。

2. 某些请求天然幂等，你不需要做什么

想象你正在银行开户。

public sealed class Account
{
    public Guid Id { get; }
    public decimal Balance { get; private set; }

    public Account(Guid id, decimal balance)
    {
        if (id == default)
            throw new InvalidOperationException("Account id must be provided");

        if (balance < 0)
            throw new InvalidOperationException("Balance cannot be negative");

        Id = id;
        Balance = balance;
    }
   
    // 取钱
    public void Withdraw(decimal amount)
    {
        if (amount < 0)
            throw new InvalidOperationException("Cannot withdraw negative amount");
        
        if (amount > Balance)
            throw new InvalidOperationException("Cannot withdraw more than existing balance");

        Balance -= amount;
    }

    // 存钱
    public void Deposit(decimal amount)
    {
        if (amount < 0)
            throw new InvalidOperationException("Cannot deposit negative amount");
        
        Balance += amount;
    }
}

前端发起的开户请求OpenAccountRequest是幂等的，只需要在开户逻辑里面检查数据表是不是存在这个AccountId。

你甚至可在数据库设置AccountId为唯一索引，让重试动作爆出异常。

public async Task HandleAsync(OpenAccountRequest request, CancellationToken token = default)
{
    var account = new Account(request.AccountId, request.Balance); 
    
    try
    {
        await _repository.InsertAsync(account, token);
    }
    catch (DuplicateKeyException)
    {
        //Ignore
    }
}

对于存钱(WithDraw）取钱（Deposit）就不行了，如果因为网络原因而重试了2次存钱请求(deposit)，岂不就是双倍快乐。

3. 乐观锁？

高并发场景下，有一个叫乐观锁的并发控制机制，乐观地认为数据在操作时不会冲突，因此在操作前不加锁，在提交时检查数据是否被修改。

类似的：常见的synchronized锁是悲观的，它假定更新很可能会冲突，故先获取锁，得到锁再更新。

CAS是乐观锁思想的一种实现，众多语言、存储、架构均支持以原子操作的形式执行 compare and swap。

不加锁，由系统保证 compare and swap 原子操作
compare是乐观锁在提交前检查数据是否被修改
swap是操作的目标

那么怎么定义数据被修改： 操作时携带数据实体的原始状态，

让前端在请求时带上需要保护的Balance, 在更新时利用AccountId+原Balance来定位并更新账户。

// 下面的前端DTO需要带上账户余额，（二次请求也是这个值）。
public sealed class DepositToAccountRequest
{
    public Guid AccountId { get; }
    public decimal Amount { get; }   // 操作金额
    public decimal AccountBalance { get; }

    public DepositToAccountRequest(Guid accountId, decimal amount, decimal accountBalance)
    {
        AccountId = accountId;
        Amount = amount;
        AccountBalance = accountBalance;
    }
}

public async Task HandleAsync(DepositToAccountRequest request, CancellationToken token = default)
{
    var account = await _repository.GetAsync(request.AccountId, token) ?? 
                  throw new EntityNotFoundException();

    account.Deposit(request.Amount);

    await _repository.UpdateAsync(account, request.AccountBalance, token);
    
    
public sealed class AccountRepository : IAccountRepository
{
    //....

    public async Task UpdateAsync(Account account, decimal expectedBalance, CancellationToken token = default)
    {
        var sql = "UPDATE Accounts SET Balance = @Balance WHERE Id = @Id AND Balance = @ExpectedBalance";
        var sqlParams = new
        {
            Id = account.Id, 
            Balance = account.Balance,  // 新余额
            ExpectedBalance = expectedBalance  // 原余额
        };

        await using var connection = new SqlConnection(_connectionString);
        await connection.OpenAsync(token);
        
        var rowsAffected = await connection.ExecuteAsync(sql, sqlParams);
        if (rowsAffected == 0)
            throw new InvalidStateException();
    }

    //....
}

读者肯定也发现了：

① 这个方式不灵活，如果不是Balance，或者不只是Balance, 那么这个sql逻辑就得变化；

② 另一方面，这个方式归根到底不识别重复请求，不知道这是重复请求，还是底层的数据真的发生了变化。

想象你被触发了第二次取钱请求，若此时刚好有人给你存了一笔钱（刚好等于你第一次取钱金额），促使你的第二次取钱请求成功了，这岂不是新的双倍悲伤。

3.1 适用于更新Put请求的状态版本方案

所以文中提出了基于宏达叙事的正经方案： 前端介入 + 状态版本
在前端DTO请求带上AccountVersion，每次更新时用AccoundId+原AccountVersion去定位、更新状态版本，如果where条件失败说明实体状态已经变化，需要报错给到前端，让前端重新拉取数据，如果where条件成功，则说明状态版本无变更，递增version，并给到前端。

    public async Task UpdateAsync(Account account, int expectedVersion, CancellationToken token = default)
    {
        var sql = "UPDATE Accounts SET Balance = @Balance, Version = @Version WHERE Id = @Id AND Version = @ExpectedVersion";
        var sqlParams = new
        {
            Id = account.Id, 
            Balance = account.Balance, 
            Version = account.Version,
            ExpectedVersion = expectedVersion
        };

        await using var connection = new SqlConnection(_connectionString);
        await connection.OpenAsync(token);
        
        var rowsAffected = await connection.ExecuteAsync(sql, sqlParams);
        if (rowsAffected == 0)
            throw new InvalidStateException();
    }

grafana 修改数据源的示例

curl 'https://grafana-chinese.observe.dev.eks.gainetics.io/api/datasources/uid/tempo' \
  -X 'PUT' \
  -H 'content-type: application/json' \
  --data-raw '{"id":2,"uid":"tempo","orgId":1,"name":"Tempo","type":"tempo","typeLogoUrl":"public/plugins/tempo/img/tempo_logo.svg","access":"proxy","url":"http://tempo:3200","user":"","database":"","basicAuth":false,"basicAuthUser":"","withCredentials":false,"isDefault":true,"jsonData":{"pdcInjected":false,"tracesToLogsV2":{"customQuery":false,"datasourceUid":"opensearch","filterBySpanID":true,"filterByTraceID":true,"spanEndTimeShift":"1m","spanStartTimeShift":"-1m","tags":[{"key":"beast","value":""}]}},"secureJsonFields":{},"version":18,"readOnly":false,"accessControl":{"alert.instances.external:read":true,"alert.instances.external:write":true,"alert.notifications.external:read":true,"alert.notifications.external:write":true,"alert.rules.external:read":true,"alert.rules.external:write":true,"datasources.id:read":true,"datasources:delete":true,"datasources:query":true,"datasources:read":true,"datasources:write":true},"apiVersion":""}'

里面有一个version就是状态版本，每次前端尝试去更细时，会带上version，去后端定位。

      ds = &datasources.DataSource{
			ID:              cmd.ID,
			OrgID:           cmd.OrgID,
            .....
			Version:         cmd.Version + 1,
			.....
		}

	var updateSession *xorm.Session
	if cmd.Version != 0 {
			// the reason we allow cmd.version > db.version is make it possible for people to force
			// updates to datasources using the datasource.yaml file without knowing exactly what version
			// a datasource have in the db.
			updateSession = sess.Where("id=? and org_id=? and version < ?", ds.ID, ds.OrgID, ds.Version)
	} else {
			updateSession = sess.Where("id=? and org_id=?", ds.ID, ds.OrgID)
	}

	affected, err := updateSession.Update(ds)
	if err != nil {
		return err
	}

这种乐观锁的思想去解决幂等问题有一个小弊端，因为乐观锁的思想本是针对并发控制，它解决了并发请求中的重复请求这一子集场景，但是带来的副作用就是高并发时，很多请求会被拒绝(重试请求会被拒绝，并发请求也会被拒绝)，效率变低，但数据不一致问题没有了，双倍悲伤也不会有。

以上是”用于更新的PUT请求“，restful规范强烈要求幂等性，通常用”状态版本“实现，

POST 的幂等性是强烈推荐的，但它不能使用状态版本，而应该使用”幂等键“（Idempotency Key）或业务唯一标识来实现。

4. 用幂等键实现Post请求幂等

put更新请求，幂等性可以用状态版本保证，是因为在请求时已经有 “状态版本” 来定义了实体快照，

Post新增请求，一开始并没有实体，我们需要一个在创建动作发生前就生成的唯一标识，来保证整个创建过程的唯一性。

① 客户端在发起创建资源的POST请求时，在HTTP头（如 Idempotency-Key: <unique_key>）或请求体中生成并携带一个全局唯一的幂等键。

② 服务器收到新增的动作，利用这个幂等键从redis或者数据库定位是不是已经存在该幂等键，存在则返回关联的实体；
如果不存在，则用事务插入幂等键和关联实体。

③ 这个幂等键的保存可以设置过期时间，或者自动清理机制来删除。

一张表来存储客户端产生的全局requestId，这个表保证requestId唯一。

那么通过事务： requestId 插入历史记录表 & 实际的请求实体，便可以真实解决幂等问题，这是真的幂等，因为这个事务真正识别出了重复请求。

public sealed class AccountRepository : IAccountRepository
{
    //....

    public async Task UpdateAsync(Account account, Guid requestId, CancellationToken token = default)
    {
        var requestSql = "INSERT INTO RequestIds VALUES (@Id)";
        var requestSqlParams = new 
        { 
            Id = requestId.ToString() 
        };

        var accountSql = "UPDATE Accounts SET Balance = @Balance WHERE Id = @Id";
        var accountSqlParams = new
        {
            Id = account.Id,
            Balance = account.Balance
        };

        await using var connection = new SqlConnection(_connectionString);
        await connection.OpenAsync(token);
        await using var transaction = await connection.BeginTransactionAsync(token);

        try
        {
            await connection.ExecuteAsync(requestSql, requestSqlParams);
        }
        catch (Exception e) when (IsDuplicateKeyException(e))
        {
            throw new DuplicateKeyException();
        }

        await connection.ExecuteAsync(accountSql, accountSqlParams);
        await transaction.CommitAsync(token);
    }

    //....
}

总结

没有最佳的方式去处理幂等，只有最合适的。
有些业务天然幂等，使用简单的全局唯一id就可以定位出二次请求。
如果你的实体更新的不频繁，可以考虑使用基于乐观锁的版本状态来解决（总体上乐观锁是更宏达叙事的一个思路，在频繁更新场景下能处理幂等问题，但体验不佳，是一味猛药）。
更常见的幂等解决方式是：基于客户端产生的幂等键，构建请求的唯一性，利用redis键值对或mysql事务识别出二次请求，是真正的实现了幂等语义。

🙏🏻🙏🏻🙏🏻

https://medium.com/swlh/retry-requests-fearlessly-with-idempotence-f6bc23f1c721

posted @ 2025-10-18 23:40 神仙别打架阅读(234) 评论(1) 收藏举报

刷新页面返回顶部

有态度马甲-- 精益码农

只做原创，专注于架构，开源，微服务，分布式等领域的技术研究和分享。知其然更知其所以然，不做眼高手低的【高手】

幂等的双倍快乐，你值得拥有

1. 软件领域二次请求无法避免

为什么幂等性很重要？

2. 某些请求天然幂等，你不需要做什么

3. 乐观锁？

3.1 适用于更新Put请求的状态版本方案

4. 用幂等键实现Post请求幂等

总结

公告

有态度马甲-- 精益码农

只做原创，专注于架构，开源，微服务，分布式等领域的技术研究和分享。 知其然更知其所以然，不做眼高手低的【高手】

幂等的双倍快乐，你值得拥有

1. 软件领域二次请求无法避免

为什么幂等性很重要？

2. 某些请求天然幂等，你不需要做什么

3. 乐观锁？

3.1 适用于更新Put请求的状态版本方案

4. 用幂等键实现Post请求幂等

总结

公告

只做原创，专注于架构，开源，微服务，分布式等领域的技术研究和分享。知其然更知其所以然，不做眼高手低的【高手】