尾递归转换能加快应用程序的速度,但不是所有的JVM都会做这种转换,很多算法用尾递归方法表示会显得格外简明。编译器会自动把这种方法转换成循环,以提高程序的性能。但在Java语言规范中,并没有要求一定要作这种转换,因此,并不是所有的Java虚拟机(JVM)都会做这种转换。这就意味着在Java语言中采用尾递归表示可能导致巨大的内存占用,而这并不是我们期望的结果。Eric Allen在本文中阐述了动态编译将会保持语言的语义,而静态编译则通常不会。他说明了为什么这是一个重要问题,并提供了一段代码来帮助判断您的即时(JIT)编译器是否会在保持语言语义的同时做尾递归代码转换。
尾递归及其转换
相当多的程序包含有循环,这些循环运行的时间占了程序总运行时间的很大一部分。这些循环经常要反复更新不止一个变量,而每个变量的更新又经常依赖于其它变量的值。
如果把迭代看成是尾递归函数,那么,就可以把这些变量看成是函数的参数。简单提醒一下:如果一个调用的返回值被作为调用函数的值立即返回,那么,这个递归调用就是尾递归;尾递归不必记住调用时调用函数的上下文。
由于这一特点,在尾递归函数和循环之间有一个很好的对应关系:可以简单地把每个递归调用看作是一个循环的多次迭代。但因为所有可变的参数值都一次传给了递归调用,所以比起循环来,在尾递归中可以更容易地得到更新值。而且,难以使用的break语句也常常为函数的简单返回所替代。
但在Java编程中,用这种方式表示迭代将导致效率低下,因为大量的递归调用有导致堆栈溢出的危险。
解决方案比较简单:因为尾递归函数实际上只是编写循环的一种更简单的方式,所以就让编译器把它们自动转换成循环形式。这样您就同时利用了这两种形式的优点。
但是,尽管大家都熟知如何把一个尾递归函数自动转换成一个简单循环,Java规范却不要求做这种转换。不作这种要求的原因大概是:通常在面向对象的语言中,这种转换不能静态地进行。相反地,这种从尾递归函数到简单循环的转换必须由JIT编译器动态地进行。
要理解为什么会是这样,考虑下面一个失败的尝试:在Integers集上,把Iterator中的元素相乘。
因为下面的程序中有一个错误,所以在运行时会抛出一个异常。但是,就象在本专栏以前的许多文章中已经论证的那样,一个程序抛出的精确异常(跟很棒的错误类型标识符一样)对于找到错误藏在程序的什么地方并没有什么帮助,我们也不想编译器以这种方式改变程序,以使编译的结果代码抛出一个不同的异常。
清单1:一个把Integer集的Iterator中的元素相乘的失败尝试
|
注意product方法中的错误。product方法通过把accumulator赋值为0调用productHelp。它的值应为1。否则,在类Example的任何实例上调用product都将产生0值,不管Iterator是什么值。
假设这个错误终于被改正了,但同时,类Example的一个子类也被创建了,如清单2所示:
清单2:试图捕捉象清单1这样的不正确的调用
|
类Example2中的被覆盖的productHelp方法试图通过当accumulator小于“1”时抛出运行时异常来捕捉对productHelp的不正确调用。不幸的是,这样做将引入一个新的错误。如果Iterator含有任何0值的实例,都将使productHelp在自身的递归调用上崩溃。
现在请注意,在类Example2的main方法中,创建了Example2的一个实例并调用了它的product方法。由于传给这个方法的Iterator包含一个0,因此程序将崩溃。
然而,您可以看到类Example的productHelp是严格尾递归的。假设一个静态编译器想把这个方法的正文转换成一个循环,如清单3所示:
清单3:静态编译不会优化尾调用的一个示例
|
于是,最初对productHelp的调用,结果成了对超类的方法的调用。超方法将通过简单地在iterator上循环来计算其结果。不会抛出任何异常。
用两个不同的静态编译器来编译这段代码,结果是一个会抛出异常,而另一个则不会,想想这是多么让人感到困惑。