【自学嵌入式：计算机组成原理】12. 视频文件的二进制存储

12. 视频文件的二进制存储

视频的数字化表示需融合空间维度（图像）与时间维度（序列），其本质可拆解为：

\[\text{视频} = \text{图片序列（空间）} + \text{音频序列（时间）} + \text{时间同步逻辑} \]

视频的每一帧可视为独立的静态图片，其二进制表示遵循“彩色图像编码”逻辑（通过RGB三通道编码像素颜色）。

分辨率：描述单帧图像的像素数量，如 1920×1080（高清1080p）表示每帧包含 1920 列、1080 行像素。
总像素数计算：
\[\text{总像素数} = \text{水平像素} \times \text{垂直像素} = 1920 \times 1080 = 2073600 \]

每个像素的颜色由红（R）、绿（G）、蓝（B） 三通道组成，每通道用 8位二进制数（1字节） 表示（覆盖0-255级亮度）。因此：

单个像素的二进制位数：\(8 \times 3 = 24\) bit（即3字节）；
单帧数据量（二进制位数）：
\[\text{单帧位数} = \text{总像素数} \times 24 = 2073600 \times 24 = 49766400 \text{ bit} \]
转换为字节（1字节=8位）：
\[\text{单帧字节数} = \frac{49766400}{8} = 6220800 \text{ 字节} \approx 6.22 \text{ MB} \]

视频是连续帧按时间排列的结果，需通过帧率（Frames Per Second，FPS） 定义“每秒显示的帧数”，以还原动态视觉效果。

若视频时长为 \(t\) 秒，帧率为 \(f\)，则总数据量（仅考虑图像部分）为：

\[\text{总数据量（字节）} = \text{单帧字节数} \times f \times t \]

示例（1080p视频，30FPS，时长1秒）：

\[\text{总数据量} = 6220800 \times 30 \times 1 = 186624000 \text{ 字节} \approx 186.6 \text{ MB} \]

视频中的音频需与图像同步编码（回顾“二进制如何表示声音”的逻辑）：

视频文件（如MP4、AVI）的二进制数据包含三类核心信息：

播放时，计算机执行以下步骤还原视频：

总结：视频的二进制表示是“空间（单帧图像RGB编码）、时间（帧序列帧率控制）、音频（采样量化编码）”的协同结果。理解单帧编码逻辑、帧率与数据量的关系，是掌握视频压缩算法（如H.264）和格式解析的基础。

posted @ 2025-07-14 08:13 秦瑞迁阅读(339) 评论(0) 收藏举报

刷新页面返回顶部