阅读(2790) (1)

第五章 Haskell递归

2016-02-24 16:09:34 更新
  • 你好,递归!
  • 实作 Maximum

  • 几个递归函数
  • "快速"排序

  • 递归地思考

你好,递归!

前面的章节中我们简要谈了一下递归。而在本章,我们会深入地了解到它为何在haskell中是如此重要,能够以递归思想写出简洁优雅的代码。

如果你还不明白什么是递归,就读这个句子。哈哈!玩笑而已!递归实际上是定义函数以调用自身的方式。在数学定义中,递归随处可见,如斐波那契数列(fibonacci)。它先是定义两个非递归的数:F(0)=0,F(1)=1,表示斐波那契数列的前两个数为0和 1。然后就是对其他自然数,其斐波那契数就是它前面两个数字的和,即F(N)=F(N-1)+F(N-2)。这样一来,_F(3)_就是F(2)+F(1),进一步便是(F(1)+F(0))+F(1)。已经下探到了前面定义的非递归斐波那契数,可以放心地说_F(3)_就是2了。在递归定义中声明的一两个非递归的值(如_F(0)_和F(1))也可以称作边界条件,这对递归函数的正确求值至关重要。要是前面没有定义_F(0)_和_F(1)_的话,它下探到0之后就会进一步到负数,你就永远都得不到结果了。一不留神它就算到了F(-2000)=F(-2001)+F(-2002),并且永远都算不到头!

递归在haskell中至关重要。命令式语言要求你提供求解的步骤,haskell则倾向于让你提供问题的描述。这便是haskell没有while或for循环的原因,递归是我们的替代方案。

实作 Maximum

maximum函数取一组可排序的List(属于 Ord类型类)做参数,并返回其中的最大值。想想,在命令式风格中这一函数该怎么实现。很可能你会设一个变量来存储当前的最大值,然后用循环遍历该 List,若存在比这个值更大的元素,则修改变量为这一元素的值。到最后,变量的值就是运算结果。唔!描述如此简单的算法还颇费了点口舌呢!

现在看看递归的思路是如何:我们先定下一个边缘条件,即处理单个元素的List时,返回该元素。如果该List的头部大于尾部的最大值,我们就可以假定较长 的List的最大值就是它的头部。而尾部若存在比它更大的元素,它就是尾部的最大值。就这么简单!现在,我们在haskell中实现它

maximum' :: (Ord a) => [a] -> a   
maximum' [] = error "maximum of empty list"   
maximum' [x] = x   
maximum' (x:xs)    
    | x > maxTail = x   
    | otherwise = maxTail   
    where maxTail = maximum' xs

如你所见,模式匹配与递归简直就是天造地设!大多数命令式语言中都没有模式匹配,于是你就得造一堆if-else来测试边界条件。而在这里,我们仅需要使用 模式将其表示出来。第一个模式说,如果该List为空,崩溃!就该这样,一个空List的最大值能是啥?我不知道。第二个模式也表示一个边缘条件,它说, 如果这个List仅包含单个元素,就返回该元素的值。

现在是第三个模式,执行动作的地方。 通过模式匹配,可以取得一个List的头部和尾部。这在使用递归处理List时是十分常见的。出于习惯,我们用个where语句来表示maxTail作为该List中尾部的最大值,然后检查头部是否大于尾部的最大值。若是,返回头部;若非,返回尾部的最大值。

我们取个List[2,5,1]做例子来看看它的工作原理。当调用maximum'处理它时,前两个模式不会被匹配,而第三个模式匹配了它并将其分为2[5,1]。 where子句再取[5,1]的最大值。于是再次与第三个模式匹配,并将[5,1]分割为5[1]。继续,where子句取[1]的最大值,这时终于到了边缘条件!返回1。进一步,将5[1]中的最大值做比较,易得5,现在我们就得到了[5,1]的最大值。再进一步,将2[5,1]中的最大值相比较,可得5更大,最终得5

改用max函数会使代码更加清晰。如果你还记得,max函数取两个值做参数并返回其中较大的值。如下便是用max函数重写的maximun'

maximum' :: (Ord a) => [a] -> a   
maximum' [] = error "maximum of empty list"   
maximum' [x] = x   
maximum' (x:xs) = max x (maximum' xs)

太漂亮了!一个List的最大值就是它的首个元素与它尾部中最大值相比较所得的结果,简明扼要。

几个递归函数

现在我们已经了解了递归的思路,接下来就使用递归来实现几个函数. 先实现下replicate函数, 它取一个Int值和一个元素做参数, 返回一个包含多个重复元素的List, 如replicate 3 5返回[5,5,5]. 考虑一下, 我觉得它的边界条件应该是负数. 如果要replicate重复某元素零次, 那就是空List. 负数也是同样, 不靠谱.

replicate' :: (Num i, Ord i) => i -> a -> [a]   
replicate' n x   
    | n <= 0    = []   
    | otherwise = x:replicate' (n-1) x

在这里我们使用了门卫而非模式匹配, 是因为这里做的是布尔判断. 如果n小于0就返回一个空List, 否则, 返回以x作首个元素并后接重复n-1次x的List. 最后, (n-1)的那部分就会令函数抵达边缘条件.

Note: Num不是Ord的子集, 表示数字不一定得拘泥于排序, 这就是在做加减法比较时要将Num与Ord类型约束区别开来的原因.

接下来实现take函数, 它可以从一个List取出一定数量的元素. 如take 3 [5,4,3,2,1],得[5,4,3]. 若要取零或负数个的话就会得到一个空List. 同样, 若是从一个空List中取值, 它会得到一个空List. 注意, 这儿有两个边界条件, 写出来:

take' :: (Num i, Ord i) => i -> [a] -> [a]   
take' n _   
    | n<=0   = []   
take' _ []     = []   
take' n (x:xs) = x : take' (n-1) xs


"快速"排序

假定我们有一个可排序的List,其中元素的类型为Ord类型类的成员. 现在我们要给它排序! 有个排序算法非常的酷, 就是快速排序(quick sort), 睿智的排序方法. 尽管它在命令式语言中也不过10行, 但在haskell下边要更短,更漂亮, 俨然已经成了haskell的招牌了. 嗯, 我们在这里也实现一下. 或许会显得很俗气, 因为每个人都用它来展示haskell究竟有多优雅!

它的类型声明应为quicksort :: (Ord a) => [a] -> [a], 没啥奇怪的. 边界条件呢? 如料,空List。排过序的空List还是空List。接下来便是算法的定义:排过序的List就是令所有小于等于头部的元素在先(它们已经排过了序), 后跟大于头部的元素(它们同样已经拍过了序)。 注意定义中有两次排序,所以就得递归两次!同时也需要注意算法定义的动词为"是"什么而非"做"这个,"做"那个,再"做"那个...这便是函数式编程之美!如何才能从List中取得比头部小的那些元素呢?List Comprehension。好,动手写出这个函数!

quicksort :: (Ord a) => [a] -> [a]   

quicksort [] = []   

quicksort (x:xs) =   

  let smallerSorted = quicksort [a | a<-xs, a<=x]  

       biggerSorted = quicksort [a | a<-xs, a > x]   

  in smallerSorted ++ [x] ++ biggerSorted

小小的测试一下, 看看结果是否正确~

ghci> quicksort [10,2,5,3,1,6,7,4,2,3,4,8,9]   
[1,2,2,3,3,4,4,5,6,7,8,9,10]   
ghci> quicksort "the quick brown fox jumps over the lazy dog"   
" abcdeeefghhijklmnoooopqrrsttuuvwxyz"

booyah! 如我所说的一样! 若给[5,1,9,4,6,7,3]排序,这个算法就会取出它的头部,即5。 将其至于分别比它大和比它小的两个List中间,得[1,4,3] ++ [5] ++ [9,6,7],我们便知道了当排序结束之时,5会在第四位,因为有3个数比它小每,也有三个数比它大。好的,接着排[1,4,3][9,6,7],结果就出来了!对它们的排序也是使用同样的函数,将它们分成许多小块,最终到达临界条件,即空List经排序依然为空,有个插图:

橙色的部分表示已定位并不再移动的元素。从左到右看,便是一个排过序的List。在这里我们将所有元素与head作比较,而实际上就快速排序算法而言,选择任意元素都是可以的。被选择的元素就被称作锚(pivot),以方便模式匹配。小于锚的元素都在浅绿的部分,大于锚都在深绿部分,这个黄黄的坡就表示了快速排序的执行方式:

递归地思考

我们已经递不少归了,也许你已经发觉了其中的固定模式:先定义一个边界条件,再定义个函数,让它从一堆元素中取一个并做点事情后,把余下的元素重新交给这个函数。 这一模式对List、Tree等数据结构都是适用的。例如,sum函数就是一个List头部与其尾部的sum的和。一个List的积便是该List的头与其尾部的积相乘的积,一个List的长度就是1与其尾部长度的和. 等等

再者就是边界条件。一般而言,边界条件就是为避免程序出错而设置的保护措施,处理List时的边界条件大部分都是空List,而处理Tree时的边界条件就是没有子元素的节点。

处理数字时也与之相似。函数一般都得接受一个值并修改它。早些时候我们编写过一个计算斐波纳契的函数,它便是某数与它减一的斐波纳契数的积。让它乘以零就不行了, 斐波纳契数又都是非负数,边界条件便可以定为1,即乘法的单位元。 因为任何数乘以1的结果还是这个数。而在sum中,加法的单位元就是0。在快速排序中,边界条件和单位元都是空List,因为任一List与空List相加的结果依然是原List。

使用递归来解决问题时应当先考虑递归会在什么样的条件下不可用, 然后再找出它的边界条件和单位元, 考虑参数应该在何时切开(如对List使用模式匹配), 以及在何处执行递归.