用RUST写流媒体服务器实战——rtmp chunk 踩坑记录

最近几个月断更了，把精力放在了新的开源项目上，一个用rust写的流媒体服务xiu。
实现过程中踩了不少坑，今天说下rtmp中的chunk。

RTMP协议确实复杂，在做这个项目之前，看过很多帖子，看过官方文档，但总是感觉不能彻底的理解清楚，在实现过一遍此协议之后，感觉清楚了不少。

目前做的测试还不够多，倒是发现了一些问题。chunk这个东西看了很久可能很多人还是不明白，说明一下，RTMP 协议除了3次握手数据，其它的，包括信令和媒体数据（音视频相关的数据），都会被封装成chunk块。

handshake的残留数据

TCP发送数据不是按照协议信令，一次只发送一个信令，有时候会发送多个，rtmp握手阶段从TCP流中读一次数据，握手结束后，会留下一部分数据，这部分要填到chunk解析缓冲数据中。

chunk size

初始化的chunk size要设置成128。

我的测试和排查过程记录如下：
我一开始的chunk size设置成了4096，用ffplay播放流，发送connect信令的时候，总是会多出一个byte，导致amf解析失败，用wireshark抓包，这个byte是没有的，一开始认为wireshark是不会出错的，以为tokio网络库，于是换成了tcp基础库，这个byte还是存在，想了个笨方法，找到一个开源的rtmp服务器，也打印出此信令，刚收到tcp数据的时候，这个byte也有，但是amf解析却成功了，接下来就是把每一步的数据都打印出来，从解析chunk到解析amf. 看看这个byte究竟是在哪个步骤消失的，最后发现，这个byte是chunk的第一个byte，fmt+csid，初始化的chunk size不对。。

状态保留

解释状态保留之前说一下chunk的各部分组成，按照官方的文档，chunk由四部分组成：

basic header
message header
extended timestamp
payload

前三部分是都可以压缩的。

basic header

 /******************************************************************
 * 5.3.1.1. Chunk Basic Header
 * The Chunk Basic Header encodes the chunk stream ID and the chunk
 * type(represented by fmt field in the figure below). Chunk type
 * determines the format of the encoded message header. Chunk Basic
 * Header field may be 1, 2, or 3 bytes, depending on the chunk stream
 * ID.
 *
 * The bits 0-5 (least significant) in the chunk basic header represent
 * the chunk stream ID.
 *
 * Chunk stream IDs 2-63 can be encoded in the 1-byte version of this
 * field.
 *    0 1 2 3 4 5 6 7
 *   +-+-+-+-+-+-+-+-+
 *   |fmt|   cs id   |
 *   +-+-+-+-+-+-+-+-+
 *   Figure 6 Chunk basic header 1
 *
 * Chunk stream IDs 64-319 can be encoded in the 2-byte version of this
 * field. ID is computed as (the second byte + 64).
 *   0                   1
 *   0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5
 *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 *   |fmt|    0      | cs id - 64    |
 *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 *   Figure 7 Chunk basic header 2
 *
 * Chunk stream IDs 64-65599 can be encoded in the 3-byte version of
 * this field. ID is computed as ((the third byte)*256 + the second byte
 * + 64).
 *    0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3
 *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 *   |fmt|     1     |         cs id - 64            |
 *   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 *   Figure 8 Chunk basic header 3
 *
 * cs id: 6 bits
 * fmt: 2 bits
 * cs id - 64: 8 or 16 bits
 *
 * Chunk stream IDs with values 64-319 could be represented by both 2-
 * byte version and 3-byte version of this field.
 ***********************************************************************/

第一个byte的前两个bit是format，有0，1，2，3四个值，这个四个值的作用是压缩message header,详细的会在下面说，后6个bit是chunk stream ID, 简称csid（关于这个字段有坑，下面会解释），6个bit的取值范围为[0,63] ，0和1有特殊用途，2到63表示真正的csid，关于特殊值0和1：

0 表示csid用 6+ 8个bit表示
1 表示csid用 6 + 16个bit表示

解析代码如下：

      let mut csid = (byte & 0b00111111) as u32;
      match csid {
       0 => {
           if self.reader.len() < 1 {
               return Ok(UnpackResult::NotEnoughBytes);
           }
           csid = 64;
           csid += self.reader.read_u8()? as u32;
       }
       1 => {
           if self.reader.len() < 1 {
               return Ok(UnpackResult::NotEnoughBytes);
           }
           csid = 64;
           csid += self.reader.read_u8()? as u32;
           csid += self.reader.read_u8()? as u32 * 256;
       }
       _ => {}
   }

message header

下面说下message header, 这部分比较复杂，有四种类型，对应着basic header里面的format字段的0~3。

type 0

/*****************************************************************/
/*      5.3.1.2.1. Type 0                                        */
/*****************************************************************
 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                timestamp(3bytes)              |message length |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| message length (cont)(3bytes) |message type id| msg stream id |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|       message stream id (cont) (4bytes)       |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
*****************************************************************/

任何字段都不省略。

type 1

/*****************************************************************/
/*      5.3.1.2.2. Type 1                                        */
/*****************************************************************
 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                timestamp(3bytes)              |message length |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| message length (cont)(3bytes) |message type id|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
*****************************************************************/

省略了message stream id，使用上一个chunk的数据。

type 2

 /************************************************/
 /*      5.3.1.2.3. Type 2                       */
 /************************************************
  0                   1                   2
  0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3
 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 |                timestamp(3bytes)              |
 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
 ***************************************************/

省略了message stream id、message length和 message type id，这个也从前边的chunk读。

type 3

所有字段全部从前边拿。

extended timestamp

这个字段是可选的，占用4个byte，如果message header里面的timestamp字段大于0xFFFFFF，则读取这个字段。

payload

最后是payload，payload的长度由 message header里面的message length决定。

chunk块的整个读取流程如下，一开始我的实现流程是这样的（有问题）

读取一个chunk的第一个byte,解析 format和chunk stream ID。
根据format解析message header:
- 如果是0 则每个字段都要从TCP流里面解析出来。
- 如果是1 则使用上一个chunk块的message stream ID。
- 如果是2 则使用上一个chunk块的message stream id、message length和 message type id。
- 如果是3 则使用上一个chunk块的message stream id、message length、message type id以及timestamp。
根据timestamp值来决定是否读取4个bytes的extendtimestamp。
根据message length读取payload值，这里有种情况比较特殊，有可能一块payload数据被分成了2个或者多个chunk块，在这一步里面就需要将这些分割的payload 数据合成一个完整的chunk数据再返回。也就是说如果读完payload数据后发现message length 不等于payload的长度，要回到步骤1从下一个chunk块里面继续读剩余的payload数据，直到读完为止。

好了，整个流程基本上介绍清楚了。大标题里面的状态保留我这里有两个意思，第一个意思是要说明一下我上面表述的问题。我说的是『从上一个chunk块』拿省略的字段，这里是不对的，因为有下面这种情况存在：

    +--------+---------+-----+------------+------- ---+------------+
    |        | Chunk   |Chunk|Header Data |No.of Bytes|Total No.of |
    |        |Stream ID|Type |            | After     |Bytes in the|
    |        |         |     |            |Header     |Chunk       |
    +--------+---------+-----+------------+-----------+------------+
    |Chunk#1 | 	3      | 0   | delta: 1000| 32        | 44         |
    |        | 	       |     | length: 32,|           |            |
    |        |         |     | type: 8,   |           |            |
    |        |         |     | stream ID: |           |            |
    |        |         |     | 12345 (11  |           |            |
    |        |         |     | bytes)     |           |            |
    +--------+---------+-----+------------+-----------+------------+
    |Chunk#2 | 3       | 2   | 20 (3      | 32        | 36         |
    |        |         |     | bytes)     |           |            |
    +--------+---------+-----+----+-------+-----------+------------+
    |Chunk#3 | 4       | 3   | none (0    | 32        | 33         |
    |        |         |     | bytes)     |           |            |
    +--------+---------+-----+------------+-----------+------------+
    |Chunk#4 | 3       | 3   | none (0    | 32        | 33         |
    |        |         |     | bytes)     |           |            |
    +--------+---------+-----+------------+-----------+------------+

注意：message header里面的字段复用是针对chunk stream ID的。

因此上面的情况，chunk2 可以复用 chunk1的message header，但是chunk 4不能复用chunk 3的，所以，在代码里面要特殊处理，每个csid的message header都需要保存一份，每解析一个chunk，读完basic header之后，需要把这个csid的上一个message header先恢复出来。

第二种情况也是我写代码时不曾想到的：

tcp数据包可以在任何地方拆分。

也就是说，可能一个chunk还没读完，这次的tcp数据就用完了，需要等下一次的数据，这种情况就要保留读取各个字段的状态了。每一个读取操作就应该设置一个标记，因此写了下面的四个大状态，message header里面有4个小的状态。

#[derive(Copy, Clone)]
enum ChunkReadState {
    ReadBasicHeader = 1,
    ReadMessageHeader = 2,
    ReadExtendedTimestamp = 3,
    ReadMessagePayload = 4,
    Finish = 5,
}

#[derive(Copy, Clone)]
enum MessageHeaderReadState {x'x
    ReadTimeStamp = 1,
    ReadMsgLength = 2,
    ReadMsgTypeID = 3,
    ReadMsgStreamID = 4,
}

例如： ReadExtendedTimestamp占用4个bytes，但是读到这里的时候就还剩下2个bytes，就要保留这个状态，下次从TCP里面读出新数据的时候从这个状态开始,再把两外两个bytes读出来。

最后rtmp chunk解析的rust完整实现在这里

最后，欢迎star。

posted @ 2021-04-12 23:21 HarlanC 阅读(1039) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

HarlanC

生有涯，知无涯。

用RUST写流媒体服务器实战——rtmp chunk 踩坑记录

用RUST写流媒体服务器实战——rtmp chunk 踩坑记录

handshake的残留数据

chunk size

状态保留

basic header

message header

type 0

type 1

type 2

type 3

extended timestamp

payload

公告