编译原理

词法分析（Lexical Analysis）
- 将源代码分解为词法单元（Token）（如关键字、标识符、运算符等）。
- 移除空白字符、注释等无关内容。
- 工具示例：词法分析器（Lexer）。
语法分析（Syntax Analysis）
- 根据语法规则检查词法单元的组合是否合法，生成抽象语法树（AST）。
- 报告语法错误（如缺少分号、括号不匹配等）。
- 工具示例：语法分析器（Parser）。
语义分析（Semantic Analysis）
- 检查程序语义的正确性（如类型匹配、变量声明、作用域规则）。
- 填充符号表（Symbol Table），标注AST的类型信息。
- 示例：发现int a = "hello";这类类型不匹配错误。
中间代码生成（Intermediate Code Generation）
- 将AST转换为与机器无关的中间表示（IR）（如三地址码、LLVM IR）。
- 目的：便于后续优化和跨平台移植。
代码优化与目标代码生成
- 代码优化：对IR进行优化（如删除冗余代码、循环优化）。
- 目标代码生成：将IR转换为目标机器代码（汇编或二进制）。
- 最终生成可执行文件或库。

例如，a = b + c 的编译流程：

在编译过程的每个阶段，编译器会检测不同类型的错误。以下是各阶段的典型错误示例：

错误类型：非法字符或不符合词法规则的符号。
示例：

非法标识符（如以数字开头）：

123var = 10  # Python变量名不能以数字开头

不支持的运算符：

a = 1 @ 2;  // '@' 在C语言中不是有效运算符

错误类型：代码结构不符合语法规则。
示例：

错误的循环结构：

for (let i = 0; i < 10; i++ {  // 缺少右括号

错误类型：代码逻辑违反语言规范（类型、作用域等）。
示例：

类型不匹配：

int a = "hello";  // 字符串无法赋给整型

作用域错误：

def foo():
    y = 10
print(y)  # y是foo()的局部变量，外部不可访问

错误类型：通常由前序阶段错误引发，或优化冲突。
示例：

不可达代码（优化时可能报错）：

return 0;
System.out.println("Unreachable");  // 无法执行的代码

错误类型：平台相关错误或优化导致的意外行为。
示例：

优化后的代码行为异常（如过度优化删除必要代码）：

// 编译器优化可能移除未使用的变量
int debug_flag = 1;  // 若未被引用，可能被优化掉

链接阶段错误（不属于编译阶段，但常被混淆）：

// 声明但未定义函数
void foo();
int main() { foo(); }  // 链接时报错：undefined reference

posted @ 2025-05-26 09:40 deyang 阅读(246) 评论(0) 收藏举报

刷新页面返回顶部