12.4.4 CPU
1. 它是什么?
在图中,North Bridge 是位于CPU架构中心偏上方的那个蓝色方块区域。
2. 它有什么作用?
北桥的主要作用是负责高速数据传输和协调CPU核心与其他关键高速组件之间的通信。根据图片中的连接箭头,它的具体功能包括:
- 内存控制器 (MC - Memory Controller):
- 图中北桥内部包含一个标为MC的绿色小块。
- 它直接连接右侧的DIMMs(内存条,支持双通道DDR3/DDR4)。
- 作用: 管理CPU与内存之间的数据读写。由于集成在CPU内部,大大降低了访问内存的延迟,提高了带宽。
- PCIe控制器 (PCIe 3.0):
- 图中北桥向右连接到PCIe 3.0,进而连接到Graphics Card(独立显卡)。
- 作用: 提供高速通道,让CPU能直接与独立显卡进行快速数据交换。
- 显示输出 (Display):
- 图中北桥向左上方连接到Display。
- 作用: 处理视频信号输出,支持高达4K的分辨率。
- 与南桥通信 (DMI/OPI):
- 图中北桥向左连接到DMI/OPI接口,进而连接到South Bridge(南桥,图左侧的绿色方块,标为Intel 100 Series)。
- 作用: 作为桥梁,将CPU核心与南桥管理的低速外设(如Wi-Fi、蓝牙、以太网、雷电接口等)连接起来。
根据图示内容,最下方的绿色方块 HD 500 Graphics Unit 是Intel Skylake处理器的集成显卡(Integrated GPU,简称核显)。
1. 图形渲染与输出 (Graphics Rendering)
- 核心功能: 它是电脑的“画师”。它负责处理所有的图形计算任务,比如显示Windows/macOS的桌面界面、运行浏览器、办公软件以及运行一些对显卡要求不高的3D游戏。
- 替代独显: 对于不玩大型游戏或不做重度3D渲染的用户,有了它就不需要额外购买图右上角显示的独立显卡(Graphics Card)。
2. 视频编解码 (Video 模块)
- 图中细节: 绿色方块内右下角有一个标为 Video 的小方块。
- 作用: 这是一个专门的硬件视频引擎。它负责硬件加速,用来高效地播放高清视频(解码)或进行视频转码(编码)。这大大减轻了CPU核心的负担,能让看4K视频更流畅且省电。
3. 图像信号处理 (ISP 模块)
- 图中细节: 绿色方块内左下角有一个标为 ISP (Image Signal Processor) 的小方块。
- 作用: 用于处理来自摄像头(如笔记本自带的Webcam)的原始图像数据。它负责降噪、自动白平衡、色彩校正等,确保视频通话或拍照时的画质清晰。
4. 利用eDRAM加速 (与右侧的连接)
- 图中细节: 它向右连接到了一个橙色的 eDRAM (64MB or 128MB) 模块。
- 作用: 这是一个非常关键的性能提升设计。集成显卡通常没有自己的显存,需要借用系统内存(速度较慢)。eDRAM作为一个巨大的高速缓存(L4 Cache),专门为这个HD 500图形单元提供极高的数据吞吐速度,从而大幅提升图形性能。
这张图片展示的是 ARM Cortex-A77 处理器的微体系结构(Microarchitecture) 框图。
以下是图中各个部分的详细解释,按照数据流向(从左到右)进行拆解:
1. 前端(Front-end):准备工作
图片左侧的方块代表指令进入处理器的最初阶段。
- 取指 (Fetch):处理器从缓存或内存中读取指令。
- 译码 / 重命名 / 派遣 (Decode / Rename / Dispatch):
- 译码:将取到的复杂指令翻译成处理器内部能理解的微操作(Micro-ops)。
- 重命名:为了解决寄存器冲突,让更多的指令可以并行执行。
- 派遣:将处理好的指令发送到下一级的发射队列中。
2. 中端(Scheduler):调度中心
- 发射 (Issue):图中中间蓝色的长条。这是一个非常关键的调度器。它的作用是检查哪些指令的数据已经准备好了,然后把这些指令“发射”给右侧空闲的执行单元。Cortex-A77 的特点之一就是拥有非常宽的发射带宽,意味着它一次能安排很多工作。
3. 后端(Back-end):执行单元
图片右侧的多个方块代表实际干活的地方。Cortex-A77 是一个超标量(Superscalar)处理器,这意味着它有多个并行的执行端口,可以同时做很多件事。
图中展示了不同类型的执行单元(Port):
- 分支 0 & 分支 1 (Branch 0/1):这就意味着有两个单元专门负责处理“跳转”指令(比如 if/else 判断)。双分支单元有助于提高预测准确率,减少流水线停顿。
- 整型 单周期 0 & 1 (Integer Single-cycle):负责简单的整数运算(如加减法、逻辑运算),速度很快,一个时钟周期就能完成。
- 整型 单/多周期 0 & 1 (Integer Single/Multi-cycle):负责更复杂的整数运算(如乘法),可能需要多个周期,也能处理简单运算。
- 总结:这里一共有 4个 算术逻辑单元(ALU),意味着处理器在一个周期内最多可以同时计算4道数学题。
- FP/ASIMD 0 & 1:这是浮点运算(Floating Point)和高级单指令多数据(ASIMD/NEON)单元。专门用来处理小数运算、多媒体数据、图形计算或向量运算。一共有2个这样的单元。
- 装载/存入 0 & 1 (Load/Store):负责计算内存地址,准备从内存读取数据或写入地址。
- 存数据 0 & 1 (Store Data):专门负责将数据写入内存的流水线。

浙公网安备 33010602011771号