什么是尾调用
尾调用(Tail Call)是函数式编程的一个重要概念,本身非常简单,一句话就能说清楚,就是指某个函数的最后一步是调用另一个函数。
代码语言:javascript复制function f(x) {
return g(x);
}
上面的代码中,函数 f 的最后一步是调用函数 g,这就是尾调用。
以下情况都不属于尾调用。
代码语言:javascript复制function f(x) {
let y = g(x);
return y;
}
function f(x) {
return g(x) 1;
}
function f(x) {
g(x);
}
从上面的代码中,情况一是调用函数 g 之后还有赋值操作,所以不属于尾调用,即使语义完全一样;情况而也属于调用后还有其他操作,即使写在一行内;情况三等同于下面的代码。
代码语言:javascript复制function f(x) {
g(x);
return undefined;
}
尾调用不一定要出现在函数尾部,只要是最后一部操作即可。
代码语言:javascript复制function f(x) {
if (x > 0) {
return m(x);
}
return n(x);
}
从上面的代码中,函数 m 和 n 都属于尾调用,因为它们都是函数 f 的最后一步操作。
尾调用优化
尾调用之所以与其他调用不同,就在于其特殊的调用位置。
我们知道,函数调用会在内存形成一个“调用记录”,又称“调用帧”(call frame),保存调用位置和内部变量等信息。如果在函数 A 内部调用函数 B,那么在 A 的调用帧上方还会形成一个和 B 的调用帧。等到 B 运行结束,将结果返回到 A、B 的调用帧才会消失。如果函数 B 内部还调用函数 C,那就还有一个 C 的调用帧,以此类推。所有的调用帧就形成了一个“调用栈”(call stack)。
尾调用由于是函数的最后一步操作,所以不需要保留外层函数的调用帧,因为调用位置、内部变量等信息都不会在用到了,直接用内层函数的调用帧取代外层函数即可。
代码语言:javascript复制function f() {
let m = 1;
let n = 2;
return g(m n);
}
f();
// 等同于
function f() {
return g(3);
}
f();
// 等同于
g(3);
上面的代码中,如果函数 g 不是尾调用,函数 f 就需要保存内部变量 m 和 n 的值、g 的调用位置等信息。但由于调用 g 之后,函数 f 就结束了,所以执行到最后一步,完全可以函数 f(x) 的调用帧,只保留 g(3) 的调用帧。
这就叫作”尾调用优化“(Tail Call Optimization),即只保留内层函数的调用帧。如果所有函数都是尾调用,那么完全可以做到每次执行时调用帧只有一项,浙江大大节省内存。这就是”尾调用优化“的意义。
代码语言:javascript复制注意:只有不再用到外层函数的内部变量,内层函数的调用帧才会取代外层函数的调用帧,否则就无法进行”尾调用优化“
function addOne(a) {
var one = 1;
function inner(b) {
return b one;
}
return inner(a);
}
上面的函数不会进行尾调用优化,因为内层函数 inner 用到了外层函数 addOne 的变量 one。
尾递归
函数调用自身成为递归。如果尾调用自身就成为尾递归。
递归非常耗费内存,因为需要同时保存成百上千个调用帧,很容易发生”栈溢出“错误(stack overflow)。但对于递归来说,由于只存在一个调用帧,所以永远不会发生”栈溢出“错误。
代码语言:javascript复制function factorial(n) {
if (n === 1) return 1;
return n * factorial(n - 1);
}
factorial(5) // 120
上面的代码时一个阶乘函数,计算 n 的阶乘,最多需要保存 n 个调用记录,复杂度为 O(n)。如果改写成尾递归,只保留一个调用记录,则复杂度为 O(1)。
代码语言:javascript复制function factorial(n, total) {
if (n === 1) return total;
return factorial(n - 1, n * total);
}
factorial(5, 1) // 1200
还有一个比较著名的例子——计算 Fibonacci 数列,也能充分说明尾递归的重要性。
非尾递归的 Fibonacci 数列实现如下:
代码语言:javascript复制function Fibonacci(n) {
if (n <= 1) { return 1 }
return Fibonacci(n - 1) Fibonacci(n - 2);
}
Fibonacci(10); // 89
Fibonacci(100); // 堆栈溢出
Fibonacci(500); // 堆栈溢出
尾递归优化的 Fibonacci 数列实现如下:
代码语言:javascript复制function Fibonacci(n, ac1 = 1, ac2 = 1) {
if (n <= 1) { return ac2 };
return Fibonacci(n -1, ac2, ac1 ac2);
}
Fibonacci(100);
Fibonacci(1000);
Fibonacci(10000);
由此可见,”尾调用优化“对递归操作意义重大,所以一些函数式编程语言将其写入了语言规格。ES6 也是如此,第一次明确规定,所有 ECMAScript 的实现都必须部署”尾调用优化“。这就是说,在 ES6 中,只要使用尾递归,就不会发生栈溢出,相对节省内存。
递归函数的改写
尾递归的实现往往需要改写递归函数,确保最后一步只调用自身。做到这一点的方法,就是把所有用到的内部变量改写成函数的参数。比如上面的例子,阶乘函数 factorial 需要用到第一个中间变量 total,那就把这个中间变量改写成函数的参数。这样的缺点是不太直观,第一眼很难看出来,为什么计算 5 的阶乘需要传入两个参数 5 和 1?
有两个方法可以解决这个问题。方法一是在尾递归函数之外再提供一个正常形式的函数。
代码语言:javascript复制function tailFactorial(n, total) {
if (n === 1) return total;
return tailFactorial(n - 1, n * total);
}
function factorial(n) {
return tailFactorial(n, 1);
}
factorial(5); // 120
上面的代码通过一个正常行驶的阶乘函数 factorial 调用尾递归函数 tailFactorial,看起来就正常多了。
函数式编程有一个概念,叫柯里化(currying),意思是将多参数的函数转换成单参数的形式。这里也可以使用柯里化。
代码语言:javascript复制function currying(fn, n) {
return function(m) {
return fn.call(this, m, n);
}
}
function tailFactorial(n, total) {
if (n === 1) return total;
return tailFactorial(n - 1, n * total);
}
const factorial = currying(tailFactorial, 1);
factorial(5);
上面的代码通过柯里化将为递归函数 tailFactorial 变成只接受 1个参数的 factorial。
第二种方法就简单多了,那就是采用 ES6 的函数默认值。
代码语言:javascript复制function factorial(n, total = 1) {
if (n === 1) return total;
return factorial(n -1, n * total);
}
factorial(5); // 120
上面的代码中,参数 total 有默认值 1,所以调用时不用提供这个值。
总结以下,递归本质是一种循环操作。纯粹的函数式编程没有循环操作命令,所有循环都用递归实现,这就是为什么尾递归对于这些语言极其重要。对于其他支持”尾调用优化“的语言(比如 Lua、ES6),只需要知道循环可以用递归代替,而一旦使用递归,就最好使用尾递归。
严格模式
ES6 的尾调用优化只在严格模式下开启,正常模式下是无效的。
这是因为,在正常模式下函数内部有两个变量,可以跟踪函数的调用栈。
- func.arguments:返回调用时函数的参数
- func.caller:返回调用当前函数的那个函数
尾调用优化发生时,函数的调用栈会改写,因此上面两个变量就会失真。严格模式禁用这两个变量,所以尾调用模式仅在严格模式下生效。
代码语言:javascript复制function restricted() {
'use strict'
restricted.caller; // 报错
restricted.arguments; // 报错
}
restricted();
尾递归优化的实现
尾递归优化只在严格模式下生效,那么在正常模式下, 或者在那些不支持该功能的环境中,有没有办法啊使用尾递归优化呢?回答是肯定的——自己实现尾递归优化。
原理非常简单。尾递归之所以需要优化,愿意是调用栈太多造成溢出,那么只要减少调用栈就不会溢出了。怎么做可以减少调用栈呢?答案是采用”循环“替换”递归“。
下面是一个争产的递归函数:
代码语言:javascript复制function sum(x, y) {
if (y > 0) {
return sum(x 1, y - 1);
} else {
return x;
}
}
sum(1, 10000); // Uncaught RangeError: Maximum call stasck size exceeded(...)
上面的代码中,sum 是一个递归函数,参数 x 是需要累加的值,参数 y 控制递归次数,且指定 sum 递归 100000 次,就会报错,提示超出调用栈的最大次数。
蹦床函数(trampoline)可以将递归执行转为循环执行。
代码语言:javascript复制function trampoline(f) {
while(f && f instanceof Function) {
f = f();
}
return f;
}
以上函数就是蹦床函数的一个实现,它接受函数 f 作为参数。只要 f 执行后返回一个函数,就继续执行。
这里是返回一个函数,然后执行该函数,而不是在函数里面调用函数,这样就避免了递归执行,从而消除了调用栈过大的问题。
然后要做的是将原来的递归函数改写为每一步返回另一个函数。
代码语言:javascript复制function sum(x, y) {
if (y > 0) {
return sum.bind(null, x 1, y - 1);
} else {
return x;
}
}
上面地代码中,sum 函数的每次执行都会返回自身的另一个版本。
现在,使用蹦床函数执行 sum 就不会发生调用栈溢出。
代码语言:javascript复制trampoline(sum(1, 100000)) // 100001
蹦床函数并不是真正的尾递归优化,下面的实现才是。
代码语言:javascript复制function tco(f) {
var value;
var active = false;
var accumulated = {};
return function accumulator() {
accumulated.push(arguments);
if (!active) {
active = true;
while( accumulated.length) {
value = f.apply(this, accumulated.shift());
}
active = false;
return value;
}
};
}
var sum = tco(function(x, y) {
if (y > 0) {
return sum(x 1, y - 1);
} else {
return x;
}
});
sum(1, 100000); // 100001
上面的代码中,tco 函数是尾递归优化的实现,它的奥妙就在于状态变量 active。默认情况下,这个变量是不被激活的。一旦进入尾递归优化的过程,这个变量就被激活了。然后,每一轮的递归 sum 返回的都是 undefined,所以就避免了递归执行;而 accumulated 数组存放每一轮 sum 执行的参数,总是有值的,这就保证了 accumulator 函数内部的 while 循环总会执行,很巧妙地将”递归“改成了”循环“,而后一轮地参数会取代前一轮地参数,保证调用栈只有一层。