Go-channel（管道）底层实现总结

channel源码地址 /src/runtime/chan.go

导图总结

exported_image (2)

channel的构成

核心结构：hchan（缓冲区 / 队列 / 锁 / 元信息）、sudog（关联 goroutine 与数据）、waitq（管理 sudog 的双向链表）、mutex（并发安全）。
核心方法：makechan（初始化）、chansend（优先唤醒接收队列→缓冲→阻塞入队）、chanrecv（优先唤醒发送队列→缓冲→阻塞入队）、closechan（标记关闭→唤醒所有队列→区分处理接收者 / 发送者）。
关键机制：同步（mutex 加锁）、阻塞（goroutine 封装为 sudog 入队 + gopark）、唤醒（从队列取 sudog+goready）、缓冲 / 无缓冲差异（数据路径不同）。

hchan

hchan 结构体：channel 在底层由 hchan 结构体表示，该结构体包含了 channel 的关键信息，
例如缓冲区（buf）、缓冲区大小（cap）、当前已使用的缓冲区元素数量（len）、用于发送和接收操作的等待队列（sendq 和 recvq）以及一个互斥锁（lock）用于保证并发安全。

type hchan struct {
    qcount   uint           // 当前缓冲区中的元素数量
    dataqsiz uint           // 缓冲区大小
    buf      unsafe.Pointer // 指向缓冲区的指针
    elemsize uint16
    closed   uint32
    elemtype *_type // 元素类型
    sendx    uint   // 发送操作在缓冲区中的索引
    recvx    uint   // 接收操作在缓冲区中的索引
    recvq    waitq  // 接收者等待队列
    sendq    waitq  // 发送者等待队列
    // lock 保护上述所有字段
    lock mutex
}

发送和接收操作

无缓冲 Channel
- 发送操作：当一个 goroutine 尝试向无缓冲 channel 发送数据时，如果没有其他 goroutine 在接收，发送操作会阻塞，该 goroutine 会被放入 sendq 等待队列。直到有接收者准备好，两个 goroutine 会被调度唤醒，数据直接从发送者转移到接收者，不需要经过缓冲区。
- 接收操作：类似地，当一个 goroutine 尝试从无缓冲 channel 接收数据时，如果没有其他 goroutine 在发送，接收操作会阻塞，该 goroutine 会被放入 recvq 等待队列。一旦有发送者准备好，数据直接传递，两个 goroutine 继续执行。
有缓冲 Channel
- 发送操作：当向有缓冲 channel 发送数据时，首先检查缓冲区是否已满。如果缓冲区未满，数据会被复制到缓冲区的 sendx 位置，sendx 递增，qcount 加一。如果缓冲区已满，发送操作会阻塞，发送者 goroutine 被放入 sendq 等待队列，直到有接收者从缓冲区取出数据，腾出空间。
- 接收操作：从有缓冲 channel 接收数据时，先检查缓冲区是否为空。如果缓冲区不为空，数据从缓冲区的 recvx 位置取出，recvx 递增，qcount 减一。如果缓冲区为空，接收操作会阻塞，接收者 goroutine 被放入 recvq 等待队列，直到有发送者向缓冲区写入数据。

同步与阻塞机制

互斥锁：hchan 结构体中的 lock 用于保护对 channel 内部状态的访问。在对 channel 进行任何操作（如发送、接收、关闭）时，都会先获取该锁，操作完成后释放锁。这确保了在并发环境下，对 channel 的操作是线程安全的。
阻塞与唤醒：当一个 goroutine 因 channel 操作阻塞时，它会被放入相应的等待队列（sendq 或 recvq），并将自身状态设置为等待状态，让出 CPU 资源。当满足操作条件（如缓冲区有空间、有数据可接收、有发送者或接收者准备好）时，等待队列中的 goroutine 会被唤醒，状态设置为可运行状态，重新进入调度队列等待被调度执行。

关闭操作

关闭过程：当调用 close(chan) 关闭 channel 时，会将 hchan 结构体中的 closed 字段设置为非零值。然后，会唤醒所有在 recvq 等待队列中的 goroutine，这些 goroutine 会接收到一个零值（对于值类型 channel）或 nil（对于指针类型 channel），并且接收操作会成功返回。对于 sendq 等待队列中的 goroutine，会向它们发送一个运行时错误（panic: send on closed channel）。
检测关闭：在接收操作时，可以通过 v, ok := <- ch 的方式来检测 channel 是否关闭。如果 ok 为 false，则表示 channel 已关闭且缓冲区中没有数据了。

waitq队列

sendq 和 recvq 是双向链表，用于存储因 channel 操作阻塞的 goroutine。
当一个 goroutine 尝试发送或接收数据但条件不满足（如无缓冲 channel 没有接收者或发送者，有缓冲 channel 缓冲区已满或为空）时，它会被放入相应的等待队列中。

type waitq struct {
    first *sudog
    last  *sudog
}

这里的 sudog 是另一个重要结构体，它代表一个等待在 channel 操作上的 goroutine 相关信息。

type sudog struct {
    g *g // 指向对应的 goroutine

    // 以下字段与 channel 操作相关
    selectdone *uint32
    next       *sudog
    prev       *sudog
    elem       unsafe.Pointer // 指向数据元素（用于发送或接收）
    acquiretime int64
    releasetime int64
    ticket      uint32
    parent      *sudog
    waitlink    *sudog
    waittail    *sudog
    c           *hchan // 指向对应的 channel
}

发送队列（sendq）和接收队列（recvq）的操作

入队操作

当一个 goroutine 因为 channel 操作需要阻塞时，会创建一个 sudog 实例，将其 g 字段指向当前 goroutine，c 字段指向对应的 channel。然后根据操作类型（发送或接收），将该 sudog 加入到 sendq 或 recvq 队列中。

出队操作

当 channel 上的操作条件满足，需要唤醒等待队列中的 goroutine 时，会从相应队列（sendq 或 recvq）中取出 sudog 实例，并唤醒对应的 goroutine。

通过这种双向链表的方式实现发送队列和接收队列，使得在 channel 操作中阻塞和唤醒 goroutine 的管理变得高效且有序，这是 Go 语言实现 channel 并发通信机制的重要基础。

`sudog`

sudog 是 Go 运行时（runtime）中一个关键的辅助结构体，主要作用是关联被阻塞的 goroutine 与它所等待的资源（如 channel、select 语句等），是实现 goroutine 阻塞 / 唤醒机制的核心载体。
sudog 作为管理 goroutine 等待状态的 “通用容器”，channel 只是其典型应用场景之一，所有需要管理 goroutine 等待 / 唤醒的同步机制，都会依赖 sudog 实现。

它的字段设计围绕 “管理等待上下文” 展开，以下是每个字段的详细解析

1. `g *g`

含义：指向当前 sudog 所关联的 goroutine（被阻塞的 goroutine 本体）。
作用：sudog 本质是 goroutine 的 “包装器”，通过 g 字段直接关联到具体的 goroutine，便于后续唤醒操作（如调用 goready(g) 将其标记为可运行状态）。

2. `selectdone *uint32`

含义：用于 select 语句的同步标记，指向一个原子操作变量（通常是 uint32 类型的指针）。
作用：在 select 语句中，当多个 case 同时就绪时，需要保证只有一个 case 被执行（避免 “惊群” 问题）。selectdone 用于标记 select 中的某个 case 已完成，其他 case 会通过检查该标记放弃执行。
- 例如：当 select 中的一个 case 被选中后，会将 *selectdone 原子置为 1，其他等待的 sudog 检测到该值为 1 时，会主动放弃处理。

3. `next sudog` / `prev sudog`

含义：双向链表的前后指针，用于将多个 sudog 连接成队列。
作用：在 channel 的 recvq（接收等待队列）或 sendq（发送等待队列）中，sudog 通过 next 和 prev 形成双向链表，由 waitq 结构（first/last 指针）管理整个队列。
- 双向链表的特性保证了入队（添加到队尾）和出队（从队头取出）操作的高效性（O (1) 时间复杂度）。

4. `elem unsafe.Pointer`

含义：指向数据缓冲区的指针，用于存储 “待发送” 或 “待接收” 的数据。
作用：在 channel 操作中，直接关联数据的内存地址，避免额外的内存拷贝：
- 发送场景（ch <- val）：elem 指向待发送的数据（如 val 的内存地址），当被唤醒时，可直接将该数据拷贝到接收方的缓冲区。
- 接收场景（val <- ch）：elem 指向接收方的缓冲区（如 val 的内存地址），当被唤醒时，可直接将发送方的数据拷贝到这里。

5. `acquiretime int64`

含义：记录当前 sudog 被创建（即 goroutine 开始等待）的时间戳（纳秒级）。
作用：主要用于调试和性能分析，例如跟踪 goroutine 的等待时长，排查长时间阻塞的问题。

6. `releasetime int64`

含义：记录当前 sudog 被释放（即 goroutine 被唤醒）的时间戳（纳秒级）。
作用：与 acquiretime 配合，可计算 goroutine 的实际等待时间，用于性能监控（如统计 channel 操作的延迟）。

7. `ticket uint32`

含义：在 select 语句中用于排序的 “序号”。
作用：select 语句中多个 case 对应的 sudog 会被分配递增的 ticket，确保唤醒时按 “先入先出”（FIFO）的顺序处理，避免某些 case 长期饥饿（不公平调度）。
- 例如：select 中先加入的 case 分配较小的 ticket，唤醒时优先处理 ticket 小的 sudog。

8. `parent *sudog`

含义：指向 “父级” sudog，用于嵌套等待场景。
作用：在复杂的同步场景中（如 goroutine 同时等待多个资源），parent 字段可建立 sudog 之间的层级关系，便于统一管理和释放。

9. `waitlink sudog` / `waittail sudog`

含义：用于管理额外的等待子队列，本质是一个小型的双向链表指针（waitlink 指向子队列头，waittail 指向子队列尾）。
作用：在某些扩展场景中（如结合其他同步原语），一个 sudog 可能需要管理多个子等待项，这两个字段用于维护子队列的结构。

10. `c *hchan`

含义：指向当前 sudog 所等待的 channel（hchan 结构体指针）。
作用：明确 sudog 与 channel 的关联关系，便于 channel 操作（如发送、接收、关闭）时快速定位到对应的 sudog 并处理：
例如：当 channel 有新数据时，通过 c.recvq 找到等待的 sudog，再通过 sudog.c 确认关联正确后唤醒。

总结

sudog 的所有字段都服务于一个核心目标：精准管理 goroutine 的等待上下文。它通过关联 goroutine（g）、等待的资源（c）、数据缓冲区（elem）以及队列关系（next/prev），配合 select 同步（selectdone/ticket）和调试信息（acquiretime/releasetime），实现了 goroutine 阻塞 / 唤醒机制的安全性和高效性。

posted @ 2023-04-26 01:23 GJH- 阅读(12) 评论(0) 收藏举报

刷新页面返回顶部

Go-channel（管道）底层实现总结

导图总结

channel的构成

hchan

发送和接收操作

同步与阻塞机制

关闭操作

waitq队列

入队操作

出队操作

sudog

1. g *g

2. selectdone *uint32

3. next *sudog / prev *sudog

4. elem unsafe.Pointer

5. acquiretime int64

6. releasetime int64

7. ticket uint32

8. parent *sudog

9. waitlink *sudog / waittail *sudog

10. c *hchan

总结

公告