AWS WAF 新功能:给 AI 爬虫收费,在边缘层直接变现你的内容

如果你运营一个内容网站,大概已经感受到了——AI 爬虫的流量比搜索引擎爬虫还猛。

AWS 的数据是:很多内容网站 50% 以上的流量来自 AI 爬虫,同比增长 300%+。这些爬虫把你的内容抓走训练模型、生成摘要,但不会给你带来回访流量。你承担了带宽和服务器成本,却得不到页面浏览量、广告曝光或订阅转化。

以前的选择很有限:要么 robots.txt 一刀切禁止,要么放任不管。

现在 AWS WAF 给了第三个选项:给它们收费

这个功能干什么的

AWS WAF Bot Control 新增了 "AI traffic monetization" 能力。简单说:

  1. 你设定每个请求的价格(可以按路径、爬虫类型、验证等级分别定价)
  2. AI Agent 访问你的内容时,在边缘层完成支付
  3. 支付通过稳定币到你指定的钱包
  4. 没付费的 AI 爬虫被拦截或降级

整个过程在 WAF 边缘完成,不需要改你的源站代码。

架构长什么样

AI Agent 请求
    ↓
CloudFront / ALB
    ↓
AWS WAF(Bot Control + AI Monetization)
    ├── 验证 Agent 身份(verified/unverified)
    ├── 检查支付状态
    ├── 未付费 → 返回 402 Payment Required
    └── 已付费 → 放行到源站
    ↓
你的内容服务器

配置示例

基本策略:按路径定价

{
  "Name": "AITrafficMonetization",
  "Priority": 1,
  "Statement": {
    "ManagedRuleGroupStatement": {
      "VendorName": "AWS",
      "Name": "AWSManagedRulesBotControlRuleSet",
      "ManagedRuleGroupConfigs": [
        {
          "AWSManagedRulesAIMonetizationConfig": {
            "InspectionLevel": "TARGETED",
            "EnableMonetization": true
          }
        }
      ]
    }
  },
  "Action": {
    "Block": {}
  },
  "VisibilityConfig": {
    "SampledRequestsEnabled": true,
    "CloudWatchMetricsEnabled": true,
    "MetricName": "AIMonetization"
  }
}

分级定价规则

{
  "MonetizationPolicy": {
    "DefaultPricePerRequest": "0.001",
    "Currency": "USDC",
    "PaymentWallet": "0x...",
    "Rules": [
      {
        "PathPattern": "/api/articles/*",
        "PricePerRequest": "0.005",
        "Description": "Full article content - premium pricing"
      },
      {
        "PathPattern": "/api/summaries/*",
        "PricePerRequest": "0.001",
        "Description": "Summary content - standard pricing"
      },
      {
        "PathPattern": "/public/*",
        "PricePerRequest": "0",
        "Description": "Public content - free tier"
      }
    ],
    "BotCategoryOverrides": [
      {
        "Category": "verified_ai_search",
        "Discount": 0.5,
        "Description": "Verified search engines get 50% discount"
      },
      {
        "Category": "unverified_scraper",
        "Action": "BLOCK",
        "Description": "Unverified scrapers blocked entirely"
      }
    ]
  }
}

CDK 部署

from aws_cdk import (
    aws_wafv2 as wafv2,
    Stack
)
from constructs import Construct

class AIMonetizationStack(Stack):
    def __init__(self, scope: Construct, id: str, **kwargs):
        super().__init__(scope, id, **kwargs)

        web_acl = wafv2.CfnWebACL(
            self, "AIMonetizationACL",
            default_action=wafv2.CfnWebACL.DefaultActionProperty(
                allow=wafv2.CfnWebACL.AllowActionProperty()
            ),
            scope="CLOUDFRONT",
            visibility_config=wafv2.CfnWebACL.VisibilityConfigProperty(
                cloud_watch_metrics_enabled=True,
                metric_name="AITrafficMonetization",
                sampled_requests_enabled=True
            ),
            rules=[
                wafv2.CfnWebACL.RuleProperty(
                    name="BotControlWithMonetization",
                    priority=1,
                    override_action=wafv2.CfnWebACL.OverrideActionProperty(
                        none={}
                    ),
                    statement=wafv2.CfnWebACL.StatementProperty(
                        managed_rule_group_statement=wafv2.CfnWebACL.ManagedRuleGroupStatementProperty(
                            vendor_name="AWS",
                            name="AWSManagedRulesBotControlRuleSet"
                        )
                    ),
                    visibility_config=wafv2.CfnWebACL.VisibilityConfigProperty(
                        cloud_watch_metrics_enabled=True,
                        metric_name="BotControl",
                        sampled_requests_enabled=True
                    )
                )
            ]
        )

几个关键问题

AI Agent 怎么知道要付费?

WAF 返回 402 Payment Required + 响应头里带支付信息。合规的 AI Agent(像 OpenAI 的 GPTBot、Anthropic 的 ClaudeBot)会按协议完成支付后重试请求。

不付费的爬虫怎么办?

你可以选择:

  • 直接 Block(返回 403)
  • 降级响应(只给摘要,不给全文)
  • Rate limit(允许少量免费请求)
  • 重定向到付费墙页面

收入怎么结算?

通过稳定币直接到你的钱包,WAF 不抽佣。但需要注意的是,这个功能本身有 WAF Bot Control 的费用(按请求计费)。

适合谁用

适合的场景:

  • 内容站(新闻、博客、研究报告)被 AI 大量抓取
  • 有 API 提供结构化数据的平台
  • 版权内容(图库、论文数据库)
  • B 端 SaaS 的数据接口

不太适合的:

  • 流量主要是真人用户的消费类网站
  • 希望 AI 引擎引用自己提高曝光的站点
  • 内容本身就是免费公开的文档站

我的看法

这个功能解决了一个真实的商业问题:AI 时代内容创作者的价值如何变现。

以前的互联网模式是"你看我的内容 → 我拿到流量 → 流量变现(广告/订阅)"。AI 爬虫打破了这个循环——它抓走了内容,但没有流量回来。

WAF AI Monetization 提供了一种新的平衡:AI 公司可以用你的内容,但要付费。这比一刀切 block 更合理——完全禁止 AI 索引可能让你在 AI 时代失去曝光。

当然,这个生态还在早期。关键问题是:有多少 AI Agent 会遵守这个协议。如果主流的 AI 公司(OpenAI、Anthropic、Google)都支持这个付费协议,那内容创作者就多了一条收入渠道。

官方文档:https://docs.aws.amazon.com/waf/latest/developerguide/waf-bot-control.html
AWS WAF 定价:https://aws.amazon.com/waf/pricing/

posted @ 2026-06-17 11:36  亚马逊云开发者  阅读(6)  评论(0)    收藏  举报