编译器实现之旅——第十五章函数调用的代码生成器分派函数的实现

在前面几个章节的旅程中，我们实现了一些各有特点的代码生成器分派函数，而在这一章的旅程中，我们将迎来整个代码生成器，乃至整个编译器实现之旅的重头戏：函数调用的实现。现在，就让我们开始吧。

1. 函数调用概观

函数调用是一个复杂的过程，从代码生成器层面看，其涉及到符号表以及多个与之相关的分派函数，此外，函数调用还需要在稍后经由链接器组件进行处理；而从虚拟机层面看，函数调用涉及到了虚拟机的所有寄存器和一些特殊的指令。由此可见，函数调用这一分派函数所涉及到的面之广，是其他分派函数所不能达到的。下面，让我们首先来看看一次函数调用的代码生成，究竟需要经历哪些步骤：

局部变量压栈
实参压栈
BP寄存器准备
IP寄存器准备
函数调用跳转
实参与局部变量退栈

我们将在下文中逐条的讨论这些步骤的含义与实现。

接下来，我们将上一章中绘制的栈内存结构图中，与函数调用相关的部分展示如下：

+-------+  ...  +-------+-------+-------+-------+-------+-------+-------+-------+-------+---------+-------+  ...
| 索引值 |  ...  | N - 8 | N - 7 | N - 6 | N - 5 | N - 4 | N - 3 | N - 2 | N - 1 |   N   |  N + 1  | N + 2 |  ...
+-------+  ...  +-------+-------+-------+-------+-------+-------+-------+-------+-------+---------+-------+  ...
|   值  |  ...  |   ?   |   ?   |   ?   |   ?   | N - 7 |   ?   |   ?   |   ?   |   ?   | BP(Old) |  IP   |  ...
+-------+  ...  +-------+-------+-------+-------+-------+-------+-------+-------+-------+---------+-------+  ...
                    ^       ^       ^       ^       ^       ^       ^       ^       ^
                    |       |       |       |       |       |       |       |       |
                    f      e[0]    e[1]    e[2]     e       d       c       b      a/BP

也许你早已发现：由于BP在栈中的位置在所有的参数之后，故我们压栈的顺序应当与符号表中变量的编号完全相反。此外，还记得我们在生成符号表的时候提到：一定要先为形参编号，再为局部变量编号吗？这样做，就使得符号表中的变量编号具有了一个非常重要的性质：任何局部变量的编号一定大于任何形参的编号。在此基础上，通过进一步的分析与整理，我们可以得到以下要点：

我们应当按照符号表中的变量编号从大到小的顺序进行压栈
实参信息存在于root的第二子节点（如果有）中
我们可以用符号表中所有变量的数量，减去root的第二子节点（如果有）的所有子节点的数量，即实参的数量，得到局部变量的数量
在对局部变量进行压栈时，我们需要判定当前这个局部变量是不是数组。如果是，则我们应首先进行数组长度次压栈，为数组内容留出空间；然后，我们应计算数组的第一个元素在栈中的索引值，并将其压栈。怎么计算呢？不难发现，其值等于：SP - 数组长度
实参不可能是一个数组

上述结论将作为我们实现函数调用的理论基础。

2. 内置函数的实现

在讨论函数调用的各个步骤之前，我们首先来看看内置函数的实现。CMM有两个内置函数：input和output。input函数没有参数，其用于读入一个数字；而output的参数是一个表达式，其用于输出这个表达式的结果。这两个内置函数，分别由IN和OUT指令提供支持。所以，当我们发现函数名为input时，我们直接生成一条IN指令即可；而当我们发现函数名为output时，我们就先为其仅有的一个参数生成代码，再追加一条OUT指令即可。请看：

vector<pair<__Instruction, string>> __CodeGenerator::__generateCallCode(__AST *root, const string &curFuncName) const
{
    /*
        __TokenType::__Call
            |
            |---- __TokenType::__Id
            |
            |---- [__ArgList]
    */

    // xxx = input();
    if (root->__subList[0]->__tokenStr == "input")
    {
        return {{__Instruction::__IN, ""}};
    }
    // output(xxx);
    else if (root->__subList[0]->__tokenStr == "output")
    {
        /*
            __TokenType::__ArgList
                |
                |---- __Expr
        */
        auto codeList = __generateExprCode(root->__subList[1]->__subList[0], curFuncName);

        codeList.emplace_back(__Instruction::__OUT, "");

        return codeList;
    }

    // 未完待续...

3. 局部变量压栈

作为函数调用的第一步，我们首先需要进行的便是局部变量压栈了。根据第一节中得到的第三条要点，我们可以从符号表中分离出所有的局部变量信息。请看：

    // ...接上文中代码

    vector<pair<__Instruction, string>> codeList;

    vector<pair<string, pair<int, int>>> pairList(__symbolTable.at(root->__subList[0]->__tokenStr).size());

    // ..., Local5, Local4, Local3, Param2, Param1, Param0
    for (auto &mapPair: __symbolTable.at(root->__subList[0]->__tokenStr))
    {
        pairList[pairList.size() - mapPair.second.first - 1] = mapPair;
    }

    // We only need local variable here
    int topIdx = pairList.size() - (root->__subList.size() == 2 ?

        // Call function by at least one parameter
        root->__subList[1]->__subList.size() :

        // Call function without any parameter
        0);

    // 未完待续...

上述代码中，我们首先将符号表中各个变量的信息按变量编号从大到小排列，然后通过减法得到了topIdx，这个变量就代表了局部变量在列表中的最大索引值。

接下来，我们进行局部变量压栈。请看：

    // ...接上文中代码

    // Push local variable
    for (int idx = 0; idx < topIdx; idx++)
    {
        // Array
        if (pairList[idx].second.second)
        {
            // Push array content (by array size times)
            for (int _ = 0; _ < pairList[idx].second.second; _++)
            {
                codeList.emplace_back(__Instruction::__PUSH, "");
            }

            /*
                The instruction "ADDR N" calculate the array start pointer (absolute index in SS).

                SS:

                    ... X X X X X X X X X $
                        ^     Size = N    ^
                        |                 |
                     SP - N               SP

            */
            codeList.emplace_back(__Instruction::__ADDR, to_string(pairList[idx].second.second));
            codeList.emplace_back(__Instruction::__PUSH, "");
        }
        // Scalar
        else
        {
            codeList.emplace_back(__Instruction::__PUSH, "");
        }
    }

    // 未完待续...

上述代码中，我们按照已经排列好的顺序，依次为每个局部变量压栈。通过判断当前变量的数组长度，我们可以获知当前变量是不是数组。如果不是，事情就好办了：直接生成一条PUSH指令即可；如果是，则我们就需要首先生成数组长度条PUSH指令，为数组内容留好空间；然后开始计算数组的第一个元素在栈中的索引值。现在，让我们回顾一下虚拟机中"ADDR N"这条指令的实现，不难发现，这条指令计算的是："AX = SP - N"，这不正是我们现在需要的索引值么？所以，我们接下来生成一条"ADDR N"指令，然后再将AX压栈，就大功告成了。

4. 实参压栈

相较于局部变量的压栈，实参的压栈就简单许多了，这要归功于"实参不可能是一个数组"这一性质。由于实参信息存在于root的第二子节点（如果有）中，所以我们可以将这部分的代码生成委托给ArgList节点的分派函数进行。请看：

    // ...接上文中代码

    // Push parameter
    if (root->__subList.size() == 2)
    {
        auto argListCodeList = __generateArgListCode(root->__subList[1], curFuncName);

        codeList.insert(codeList.end(), argListCodeList.begin(), argListCodeList.end());
    }

    // 未完待续...

那么，__generateArgListCode函数又是怎么实现的呢？请看：

vector<pair<__Instruction, string>> __CodeGenerator::__generateArgListCode(__AST *root, const string &curFuncName) const
{
    /*
        __TokenType::__ArgList
            |
            |---- __Expr
            |
            |---- [__Expr]
            .
            .
            .
    */

    vector<pair<__Instruction, string>> codeList;

    for (int idx = root->__subList.size() - 1; idx >= 0; idx--)
    {
        auto exprCodeList = __generateExprCode(root->__subList[idx], curFuncName);

        codeList.insert(codeList.end(), exprCodeList.begin(), exprCodeList.end());
        codeList.emplace_back(__Instruction::__PUSH, "");
    }

    return codeList;
}

ArgList节点含有一至多个Expr子节点，我们要做的便是倒序遍历这些子节点，生成当前子节点的代码；由于Expr节点的代码最终一定会将结果装载入AX中，故我们直接再追加一条PUSH指令即可。

5. 函数调用

终于可以进行函数调用了！但如果你看到这一节下面大片的文字心生畏惧的话，我可以提前给你透露一个小秘密：这一节说了半天，其实就只有一行代码（虽然有大段的注释），请看：

    // ...接上文中代码

    /*
        The instruction "CALL N" perform multiple actions:

        1. SS.PUSH(BP)

            Now the SS is like:

            ... Local5 Local4 Local3 Param2 Param1 Param0 OldBP

        2. BP = SS.SIZE() - 2

            Now the SS is like:

            ... Local5 Local4 Local3 Param2 Param1 Param0 OldBP
                                                     ^
                                                     |
                                                     BP

        3. SS.PUSH(IP)

            Now the SS is like:

            ... Local5 Local4 Local3 Param2 Param1 Param0 OldBP OldIP
                                                     ^
                                                     |
                                                     BP

        4. IP += N

        In addition, the "N" of the "CALL N" is only a function name right now,
        it will be translated to a number later. (See the function: __translateCall)
    */
    codeList.emplace_back(__Instruction::__CALL, root->__subList[0]->__tokenStr);

    // 未完待续...

可见，确实只有一行代码，并且这行代码看上去也没有什么特别之处，其生成了一条形如："CALL 函数名"的指令。但正如我们已经猜到的那样：这条指令肯定没有看上去这么简单。让我们开始分析它吧。

在局部变量和实参压栈都完成后，我们接下来要做的第一件事是：为LD指令的基石——BP寄存器做准备。说的好像很复杂的样子，实际上这一动作只需要一行类似于"BP = SP"的代码，将BP设定为栈顶就行了。但是，有一件非常重要的事情我们不能忘记：BP的值在"BP = SP"的时候并不是无意义，可以随意覆盖的，而是作为外部函数，如main函数，甚至是这个函数自己（递归调用）的BP存在的。这怎么办？不难想到，如果我们先将旧的BP压栈，保存下来，再进行"BP = SP"，问题就解决一半了，因为我们至少没有将旧的BP就这么丢掉，还是能找回来的；在函数调用结束后，我们再想个办法（稍后我们就能看到这个办法）将旧的BP从栈上恢复出来，问题的另一半就也解决了。

接下来，让我们思考这样的一个问题：不难想到，函数调用本质上就是一个跳转动作，但不同于普通的JMP指令，函数调用是一个"回旋镖"，在调用结束后，IP是需要回来的。这怎么实现？上文中我们讨论的针对BP的解决方案带给我们灵感：我们也可以通过类似的方案实现这样的"回旋镖"。我们可以在跳转前先将旧的IP压栈，保存下来，再进行跳转；在函数调用结束后，我们再想个办法（同样，稍后我们就能看到这个办法）将旧的IP从栈上恢复出来，让虚拟机这个"回旋镖"从遥远的函数那儿"飞回来"。

当我们兴致勃勃的将旧的IP压栈后，我们很快就又停下了，因为我们又遇到了一个新的问题，而且这个问题似乎很严重：

我们应该去哪？

我们无法回答这个问题。我们现在充其量只知道自己现在在哪，以及，正在调用哪个函数；但是并不知道这个函数在哪，从而，也就不知道应该去哪了。那么，什么时候才能知道应该去哪呢？不难想到：当所有的代码都呈现在我们面前的时候，我们当然就知道应该去哪了。这正是链接器所具有的功能。所以，我们在这里需要暂且生成一条"CALL 函数名"伪指令，并在稍后通过链接器的广阔视野，将这条伪指令变为一条真正的"CALL N"指令。

将上文中的全部内容整合起来，就是"CALL N"指令（虽然它现在还只是"CALL 函数名"伪指令）所进行的全部操作了，总结一下：

将旧的BP压栈
根据栈顶设定新的BP
将旧的IP压栈
根据N设定新的IP

在这一节的末尾，让我们来讨论CALL指令的好兄弟——RET指令。

RET指令是每个非main函数的最后一条指令。在CALL结束后，我们正是通过这条指令，同时将旧的IP和BP从栈上恢复出来，让虚拟机回到函数调用之前的状态，就好像什么事都没发生一样（除了AX）。说的好像很厉害的样子，实际我们需要做的却很简单：由于我们是先将旧的BP压栈，再将旧的IP压栈，所以RET指令只需要反着来，先将旧的IP退栈，再将旧的BP退栈即可。结合虚拟机的实现我们不难发现，在IP退栈后，紧接着的就是一次"IP++"，这就使得IP越过了"CALL N"这条指令，来到了函数调用后的下一条指令上。一切都显得那么自然，不是么？

最后，就让我们来看一段在下一章才会真正出现的"神秘代码"，来遥望一番CALL指令与RET指令之间的默契配合吧：

// 为每个非main函数添加最后一条RET指令
if (curFuncName != "main")
{
    /*
        The instruction "RET" perform multiple actions:

        1. IP = SS.POP()

            Now the SS is like:

            ... Local5 Local4 Local3 Param2 Param1 Param0 OldBP

        2. BP = SS.POP()

            Now the SS is like:

            ... Local5 Local4 Local3 Param2 Param1 Param0

        So we still need several "POP" to pop all variables.
        (See the function: __generateCallCode)
    */
    codeList.emplace_back(__Instruction::__RET, "");
}

6. 实参与局部变量退栈

在函数调用结束后，我们需要将先前为了函数调用而进行的压栈全部退栈。那么，我们究竟需要退栈多少次呢？稍加思考，不难得到以下结论：

对于符号表中的每个变量，不管是不是数组，都需要退栈一次
如果一个变量是数组，则还应额外退栈数组长度次

由此，我们可以得到以下实现：

    // ...接上文中代码

    // After call, we need several "POP" to pop all variables.
    for (auto &[_, mapVal]: __symbolTable.at(root->__subList[0]->__tokenStr))
    {
        // Any variable needs a "POP"
        codeList.emplace_back(__Instruction::__POP, "");

        // Pop array content (by array size times)
        for (int _ = 0; _ < mapVal.second; _++)
        {
            codeList.emplace_back(__Instruction::__POP, "");
        }
    }

    // 终于不是未完待续了！
    return codeList;
}

至此，函数调用的代码生成器分派函数的实现就全部完成了。但是，我们仍有三个遗留问题尚待解决：

我们需要为全局变量压栈
main函数需要在程序启动时被自动调用
我们需要实现一个链接器，以将所有的CALL伪指令转变为一条真正的CALL指令

这些问题，我们都将在下一章的旅程中进行讨论。请看下一章：《全局变量、main函数、代码装载与链接器》。

posted @ 2021-02-19 16:51 樱雨楼阅读(321) 评论(0) 收藏举报

刷新页面返回顶部

樱雨楼

编译器实现之旅——第十五章 函数调用的代码生成器分派函数的实现