使用 Lambda 表达式编写递归一：前言及基础

2013-04-09 16:31 鹤冲天阅读(11374) 评论(8) 收藏举报

《Drawing Hands》作者：埃舍尔

本系列文章目录：

前言

这是一个比较古老的话题，三年半之前，老赵就此写过一篇很文章《使用Lambda表达式编写递归函数》。其中提出了伪递归的概念，提出了自己的解决方式，也引出了装配脑袋 使用不动点组合子的解决办法。此后好长一段时间，伪递归和不动点组合子成了两个园子里的两大热门话题。

当年我也写了篇文章《反驳老赵之 “伪”递归》参与了争论，不过对老赵提出的解决方式及装配脑袋的不动点组合子思路，一直没弄清楚。中间一段时间，工作忙，忘却了。

最近比较轻闲，静下心来学习了下相关的的一些理论，并深入思考，略有所悟，在此和大家分享下。

本文及后续章节会用到相当复杂的泛型及 lambda 表达式，请做好相关技术和心理准备。

使用 Lambda 表达式构建递归函数

很多朋友认为这很容易，随手便可用 lambda 表达式写出一个阶乘递归：

1	Func<int, int> fact = x => x <= 1 ? 1 : x * fact(x - 1);

不过，很抱歉，这行代码是无法通过编译的，VS 提示：使用了未赋值的变量 fact。

有种简单的解决办法，把上面这行代码拆成两行：

1 2	Func<int, int> fact = null; fact = x => x <= 1 ? 1 : x * fact(x - 1);

不过这种写法也有问题，老赵说得比较清楚，我就不在赘述了，请查看《使用Lambda表达式编写递归函数》一文中伪递归部分。

那么如何解决 lambda 表达式构建递归函数的问题呢？根据函数式编程理论，我们可以使用不动点组合子。

在学习不动点组合子之前，需要先了解更基础 λ 演算。

λ 演算

λ 演算的基础请大家参考维基百科：

非形式化的描述

请确保你已经理解了文中几个表达式的等价关系：

1 2	(λf. f 3)(λx. x + 2) == (λx. x + 2) 3 == 3 + 2 (λx. λy. x - y) 7 2 == (λy.7 - y) 2 == 7 - 2

还清楚知道函数应用（application）的概念及其左结合性：

1	f x y == (f x) y

还有它的各种等价变换

1	f x y == (f x) y = (f(x))y = (f(x))(y) = f(x)(y)

归约

并会运用三个常用的规约（Reduction）

不动点组合子

请参考：

定义

不动点组合子（Fixed-point combinator，或不动点算子，使用 FIX 表示）是计算其他函数的一个不动点的高阶函数。

不动点算子具有以下特性，对于任何函数 f 都有：

1	FIX f = f (FIX f)

定义匿名的递归函数

不动点组合子允许定义匿名的递归函数，具体来说是将一个非递归的单步函数（只执行递归中的一步，a single step of this recursion，使用 g 表示）转换为递归函数。

如下是阶乘的单步函数定义：

1	g = λf. λn. (ISZERO n) 1 (MULT n (f (PRED n)))

FIX g 可获取到匿名的递归函数：

1	FIX g = λn. (ISZERO n) 1 (MULT n ((FIX g) (PRED n)))

向 FIX g 的参数 n 传入值 5，可最终得出：

1	FIX g 5 = 5 * (4 * (3 * (2 * (1 * 1)))) = 120

常用的不动点组合子

不动点组合子中最有名的（也可能是最简单的）是 Y 组合子：

1	Y = λf. (λx. f (x x)) (λx. f (x x))

另一个常见不动点组合子是图灵不动点组合子（阿兰·图灵发现的）:

1	Θ = (λx. λy. (y (x x y))) (λx.λy.(y (x x y)))

传值调用（call-by-value）

在 λ 演算中，每个表达式（lambda term）都代表一个只有单独参数的函数，这个函数的参数本身也是一个只有单一参数的函数，同时，函数的值是又一个只有单一参数的函数。

根据此描述，可知 λ 演算中函数只有一个参数，这个参数是一个函数，而不是一个值。而对于我们常见的递归（阶乘、斐波那契数列求值），参数都是值（自然数）。两者是不匹配的。

为了适当传值调用，需要将不动点组合子 η-展开：

简单而言 η-变换是说 λx. f x 和 f 可以互相转换。从 f 这种简单形式 η-变换为 λx. f x 复杂形式，称为 η-展开。

对于 Y 组合子，通常是将其中的 (x x) η-展开为 λy. x x y，由此得出传值调用版本的 Y组合子（也称为 Z 组合子）：

1	Y = λf. (λx. f (λy. x x y)) (λx. f (λy. x x y))

如果不展开呢？会怎样？

如果使用不展开的不动点算子，也能写出可编译通过的代码，但最终执行会陷入死循环，直至堆栈溢出。

小结

后续章节将使用以下符号和名称，不再另行说明：

FIX：不动点组合子
g：单步函数
n：表示递归函数的参数（在阶乘、斐波那契数列求值中是一个自然数）

对于 FIX、g、n：

FIX g：将会生成对应的递归函数
FIX g n：将进行递归运算

λ 演算表达式与 c# lambda 表达式的对应关系

λx. x + 2

λx. x + 2 在 c#中的 lambda 表达式可表式为：x => x+ 2；

假定 x 的 int 类型，可写作：

1	Func<int, int> f = x => x + 2;

相应 (λx. x + 2) 1 可写为：

1	var result = f(1); // 结果为 3

λx. λy. x + y

复杂点，λx. λy. x + y 用 c# 的 lambda 表达式表示为：x => y => x + y；

x, y 类型为均整数时，可写作：

1	Func<int, Func<int, int>> f = x => y => x + y;

相应 (λx. λy. x + y) 1 2 便是：

1	var result = f(1)(2); // 结果为 3

λx. λy. λz. x + y + z

再复杂些，λx. λy. λz. x + y + z 表示为：x => y=> z => x + y + z，三个参数都为 int 时 c# 代码：

1	Func<int, Func<int, Func<int, int>>> f = x => y => z => x + y + z;

可如下调用：

// (λx. λy. λz. x + y + z) 1 2 3
var result1 = f(1)(2)(3);    //结果为 6

// (λx. λy. λz. x + y + z) 1  →  λy. λz. 1 + y + z 
Func<int, Func<int, int>> g = f(1); 
// (λy. λz. 1 + y + z) 2  →  λz. 1 + 2 + z  →  λz. 3 + z
Func<int, int> h = g(2);
// (λz. 3 + z) 3  →  3 + 3  →  6
var result2 = h(3);        // 结果为 6

每 5 行，向 f 传入一个常量 1，返回一个新的方法 g；再经过第 7 行，向 g 传入常量 2，再次返回一个新方法 h。

方法 h 只能接受一个参数，最后得出 h(3) = 6。

为什么不是 (x, y, z) => x + y + z？

也许你会有疑问，不就是 x、y、z 三个整数加起来嘛，为什么搞这么复杂，像下面这样不是更简单吗？

1 2	Func<int, int, int, int> f = (x, y, z) => x + y + z; var result = f(1, 2, 3);

确实简单，不过：

在 λ 演算中，每个表达式（lambda term）都代表一个只有单独参数的函数，这个函数的参数本身也是一个只有单一参数的函数，同时，函数的值是又一个只有单一参数的函数。

注意都是只有一个参数，对应到 c# 的 lambda 表达式，也应是一个参数，所以是：x => y=> z => x + y + z。

总结

λ 演算表达式	c# lambda 表达式
λx. x + 2	x => x+ 2
λx. λy. x + y	x => y => x + y
λx. λy. λz. x + y + z	x => y=> z => x + y + z

好像有些规律：对于一个 Lambda terms，去掉“λ”并把“.”替换为”=>”便可变成对应 lambda 表达式。（注意，这个规律不严谨！）

练习一下，看看下面这个如何转为 lambda 表达式：

1	λx. λn. (g (x x) n)

先对它进行一步演算得出：

1	λx. λn. (g (x(x)) (n))

运用上的的规律，可以写出 lambda 表达式：x => n => g((x(x))(n)

对于复杂点的如：λx. f ( λv. (x x) v)，这条规律就不适用了。文后续部分会通过演算绕开这种复杂的转换，不对此进行讨论。

理解本文中的泛型和 lambda 表达式

对于上一部分使用的泛型和 lambda 表达式，尤其是下面这行代码，你需要花点时间去理理思路（因为后续章节中泛型要远比此复杂）：

1	Func<int, Func<int, Func<int, int>>> f = x => y => z => x + y + z;

如果对你对泛型和 lambda 认识不是非常深刻的话，难度有点大，不妨先从下面这个简单点的开始：

1	Func<int, Func<int, int>> f = x => y => x + y;

换种写法，或许有助于理解：

Func<int, Func<int, int>>  f = x => {              
    Func<int, int> g =  y => { return x + y ;};
    return g;
};

本文简单阐述了 lambda 构建递归函数的问题，粗略提及 λ 演算及不动点组合子的知识，并总结了下 λ 演算表达式与 c# lambda 表达式的对应关系。

下一篇文章将推断 FIX、g 的参数及返回值类型。

刷新页面返回顶部

鹤冲天对月狂饮，惊叹青春过半。顾镜自怜，提眉强作欢颜。

使用 Lambda 表达式编写递归一：前言及基础

前言

使用 Lambda 表达式构建递归函数

λ 演算

非形式化的描述

归约

不动点组合子

定义

定义匿名的递归函数

常用的不动点组合子

传值调用（call-by-value）

小结

λ 演算表达式与 c# lambda 表达式的对应关系

λx. x + 2

λx. λy. x + y

λx. λy. λz. x + y + z

总结

理解本文中的泛型和 lambda 表达式

About

鹤冲天 对月狂饮，惊叹青春过半。顾镜自怜，提眉强作欢颜。

使用 Lambda 表达式编写递归一：前言及基础

前言

使用 Lambda 表达式构建递归函数

λ 演算

非形式化的描述

归约

不动点组合子

定义

定义匿名的递归函数

常用的不动点组合子

传值调用（call-by-value）

小结

λ 演算表达式与 c# lambda 表达式的对应关系

λx. x + 2

λx. λy. x + y

λx. λy. λz. x + y + z

总结

理解本文中的泛型和 lambda 表达式

About

鹤冲天对月狂饮，惊叹青春过半。顾镜自怜，提眉强作欢颜。