Haskell学习-函数式编程初探

作者: jeffzhong | 来源:发表于2018-08-08 04:37 被阅读4次

    原文地址:Haskell学习-函数式编程初探
      为什么要学习函数式编程?为什么要学习Haskell?
      .net到前端,C#和JavaScript对我来说如果谈不上精通,最起码也算是到了非常熟悉的程度。这两门语言就像是我的盾牌和宝剑,给我保驾护航,开山劈石,伴随着我不断成长。同时C#和JavaScript它们本身也在不断地进化,不断出现越来越多方便的语法糖,但追根到底很多都是从函数式语言汲取的精华。比如高阶函数,lambada表达式,柯里化等。
      于是从探险的角度,以好奇的心态开始学习函数式语言,探索这个宝库,拾取可供临摹的珍宝。最起码它能让你多一个不同的角度看待编程语言,影响你的思考方式。 学习的对象当然选择函数式语言的集大成者-Haskell。

    什么是Haskell和函数式编程

      Haskell 是一门纯粹函数式的语言。
      函数式编程是面向数学的抽象,将计算描述为一种表达式求值。命令式编程是关于解决问题的步骤,函数式编程是关于数据的映射。在纯粹函数式程式语言中,你不是像命令式语言那样命令计算机「要做什么」,而是通过用函数来描述出问题「是什么」,也就是所谓范畴论中的映射关系。函数式语言有以下的特性:

    • 函数是一等公民,可以在任何地方定义,在函数内或函数外,可以作为函数的参数和返回值,可以对函数进行组合
    • 变量的值是不可变的(immutable),也就是说不允许像命令式编程语言中那样多次给一个变量赋值。
    • 函数式语言的条件语句,循环语句等也不是命令式编程语言中的控制语句,而是函数的语法糖
    • 惰性求值
    • 抽象数据类型
    • 灵活的多态
    • 高阶函数(Higher-order function)
    • 柯里化(Currying)
    • 闭包(Closure)

    函数式编程的优点

      函数式的最主要的好处主要是不可变性带来的。没有可变的状态,函数就是引用透明(Referential transparency)的和没有副作用(No Side Effect)。

    1. 函数即不依赖外部的状态也不修改外部的状态,函数调用的结果不依赖调用的时间和位置,这样写的代码容易进行推理,不容易出错。这使得单元测试和调试都更容易。
    2. 由于(多个线程之间)不共享状态,不会造成资源争用(Race condition),也就不需要用锁来保护可变状态,也就不会出现死锁,这样可以更好地并发,能够更好地利用多个处理器(核)提供的并行处理能力。

    Haskell基本语法

    1. 变量和函数
      一起介绍是因为在我看来,haskell中变量和函数是没有区别的。它们都是表达式,根据表达式的不同形式,分别对应到命令式语言中变量和函数的概念。 而且 haskell变量 赋值后就是不可变的,该 变量 就等于被赋予的值,与命令式语言中 变量 是内存地址的引用是完全不同的概念。 硬要对应的话它更像是 C# 中的不可变量 conststatic readonly
      你能从下面代码中区分出哪些是变量,哪些是函数吗?

      a = 1 -- 变量
      arr = map (*2) [1,2,3] -- 变量还是函数?
      maxNum  = foldr max 0 -- 函数
      
      --执行
      a  
      > 1
      
      arr
      > [2,4,6]
      
      maxNum [3,5,1]
      > 5
      

      定义函数: 函数名 参数 = 代码
      调用函数: 函数名 参数
      调用函数不用大括号( ),注意的是函数首字母不能大写。 还有maxNum看不到形式参数是因为柯里化可以去掉参数,后面会介绍。

    2. if else
      haskell中 if else 表达式中的 else 部分不能省略,也就是你不能只有 if 部分

      -- 等于小于大于0 分别对应 0,-1,1
      sign x = if x == 0 then 0
               else if x < 0 then -1
               else 1
      
    3. case of
      case of 表达式,与其他语言的switch case 类似。

      -- 求出列表第一项
      head' xs = case xs of
                 []    -> "No head for empty lists!"
                 (x:_) -> show x
      -- 执行
      head' "hello"
      >'h'
      head' [3,2,1]
      > 3
      
    4. 函数模式匹配
      函数模式匹配的方式定义 head',以及定义阶乘函数 factorial,它本质上就是 case of 的语法糖。函数模式匹配,减少了一大堆类似 if else 的判断逻辑,是我最喜欢的特性之一。

      -- 求出列表第一项
      head' [] = "No head for empty lists!"
      head' (x:_) = show x
      -- 阶乘
      factorial 0 = 1
      factorial n = n * factorial (n - 1)
      
      --执行
      head' [3,2,1]
      > 3
      factorial 5
      > 120
      
    5. guardswhere
      guards,类似 if else 表达式,但可读性更强,where语句定义的是局部变量表达式,它只能放在语句尾部,guards同样也是非常好的定义方式。

      bmiTell weight height
          | bmi <= 18.5 = "You're underweight,you emo,you!"
          | bmi <= 25.0 = "You're supposedly normal. Pffft,I bet you're ugly!"
          | bmi <= 30.0 = "You're fat! Lose some weight,fatty!"
          | otherwise   = "You're a whale,congratulations!"
          where bmi = weight / height ^ 2
      
    6. let in
      let in 表达式,let 中绑定的名字仅对 in 部分可见。

      -- 圆柱体面积
      cylinder r h =
          let sideArea = 2 * pi * r * h
              topArea = pi * r ^2
          in  sideArea + 2 * topArea
      

    递归

    1. 我们使用递归来实现斐波那契数列和快速排序,haskell写的快速排序是我见过的最容易理解的版本了,专门为解决数学问题而生的 haskell 在解决算法和数据结构方面果然是不同凡响。

      -- 斐波那契数列
      fab 1 = 1
      fab 2 = 1
      fab n = fab (n-1) + fab (n-2)
      
      -- 快速排序
      quicksort [] = []
      quicksort (x:xs) =
        let smallerSorted = quicksort [a | a <- xs, a <= x]
            biggerSorted = quicksort [a | a <- xs, a > x]
        in smallerSorted ++ [x] ++ biggerSorted
      
    2. 尾递归实现常用的map和filter函数

    • [] 表示空列表

    • _ 匹配的是任意值。

    • (x:xs) 非常有用的列表匹配模式,x表示第一项,xs表示除去第一项之后的部分。使用(x:xs)可以方便的实现尾递归

      -- map
      map' f []     = []
      map' f (x:xs) = f x : map' f xs
      
      -- filter
      filter' _ []=    [] -- _代表任意值
      filter' f (x:xs) 
              | f x = x : filter' f xs 
              | otherwise = filter' f xs
      

    数据类型

    了解了haskell基本语法后,我们再进一步了解haskell基本数据类型

    1. :type 获取任何表达式的类型,可以用简写形式 :t

    2. 基本数据类型

      • Int 表示整数
      • Integer 也是整数,但表示的是无界的,所以可以表示非常大的数
      • Float 表示单精度的浮点数
      • Double 表示双精度的浮点数
      • Bool 表示布尔值,它只有两种值:True 和 False
      • Char 表示一个字符。一个字符由单引号括起,一组字符的 List 即为字符串
      • List 列表中所有的项都必须是同一类型。
      • Tuple 的类型取决于它的长度及其项的类型。
      :t 1 -- Number
      1 :: Num p => p
      
      :t 1::Integer
      1::Integer :: Integer
      
      :t 1::Float
      1::Float :: Float
      
      :t False -- Bool
      False :: Bool
      
      :t 'c' --字符
      'c' :: Char
      
      :t "hello" -- 字符串
      "hello" :: [Char]
      
      :t [1,2,3] -- 列表list
      [1,2,3] :: Num a => [a]
      
      :t [("hi",1),("there",2)] -- Tuple
      [("hi",1),("there",2)] :: Num b => [([Char], b)]
      
      
      • 1::Integer 表示直接指定类型,如果不指定编译器会自动推导出类型,数字类型会推导出Number类型,它包括Int,Integer,Float,Double
      • [Char]String 表示的都是字符串类型
      • [1,2,3] :: Num a => [a] 列表中的 a 表示任意类型,意思你可以是Bool,Stirng,Int等等
      • [("hi",1),("there",2)] 这就是Tuple类型,列表里面的每个项都用 () 包起来,其中的每个项的元素数据类型必须相同,每个tuple中元素个数必须相等,但是每个tuple中的项可以不同类型,比如 ("hi",1) 中一个是字符串,一个是Int。
    3. 函数也有类型,定义函数的时候,加上参数的类型和输出类型是好习惯。

      • &&、||、not 表示与或非逻辑
      • == 表示等于
      • /= 表示不等于
      • ++ 连接列表,相当于concat
      • a, b这种类型参数,表示可以传入任何类型。
      • (Num a, Num p, Ord a) => a -> p=> 之前表示的是类型约束,这里的 a 限定只能是 Num 类型和 Ord 类型。Num表示数字类型,Ord则表示可比较大小的型别,包含如下三种型别之一:GT, LT, EQ。
      :t head -- 取列表第一项的函数
      head :: [a] -> a
      
      :t sign -- sign函数
      sign :: (Num a, Num p, Ord a) => a -> p
      
      :t (==) -- 是否相等
      (==) :: Eq a => a -> a -> Bool
      
      :t (++) -- 列表连接函数
      (++) :: [a] -> [a] -> [a] 
      
      -- 执行  
      sign 2
      > 1
      
      head [3,2,1]
      > 3
      
      "abc" == "bbc"
      > False
      
      "hello " ++ "world"
      > "hello world"
      
      

    List 和 List comprehension

    1. 列表常用的函数
      null 列表是否为空
      length 返回列表长度
      head 返回列表第一个元素
      tail 返回列表除第一个元素以后的所有元素
      last 返回列表最后一个元素
      init 返回列表除最后一个元素之前的所有元素
      take n 返回列表前n个元素
      drop n 丢弃列表前n个元素
      maximum 返回最大的元素
      minimum 返回最小的元素
      sum 返回元素的和
      elem 元素是否包含于列表

    2. list range
      方便的range,尾递归加上list range,你真的还需要命令式语言中的循环语句吗?

      [1..10] -- 1到10的列表
      > [1,2,3,4,5,6,7,8,9,10]
      
      ['a'..'z'] -- a到z的字母字符串
      > "abcdefghijklmnopqrstuvwxyz"
      
      take 10 [1,3..] -- 前10个奇数
      > [1,3,5,7,9,11,13,15,17,19]
      
      take 10 (cycle[1,2,3]) -- 取前10的[1,2,3]序列
      > [1,2,3,1,2,3,1,2,3,1]
      
      take 5 $ repeat 3 -- 取前5项的3序列
      > [3,3,3,3,3]
      
      replicate 5 10  -- 相比 take repeat更方便的用法
      > [10,10,10,10,10]
      
      
    3. list comprehension
      list comprehension 相当于map 和 filter的函数的增强版, | 之前等于map, | 之后等于filter, 尤其在多限制条件和同时实现map,filter功能时更加明显。是个非常强大和有用的特性,完全可以替代列表的 map 和 filter 函数。
      list comprehension 其实是由 monadapplicative functor 生成的语法糖。

      [x*2 | x <- [1..10], x*2 >= 12] -- 取乘以 2 后大于等于 12 的元素, 等于map结合filter
      > [12,14,16,18,20]
      
      [if x `mod` 2 == 0 then "even" else "odd" | x <- [1..10]] -- 偶数转换为even,基数为odd, 等于map
      > ["odd","even","odd","even","odd","even","odd","even","odd","even"]
      
      [ x | x <- [10..20], x /= 13, x /= 15, x /= 19] -- 取除了13、15、19之外的元素,多个限制条件,等于filter
      > [10,11,12,14,16,17,18,20]
      
      [ x*y | x <- [2,5,10], y <- [8,10,11]] -- 求两个列表所有可能的组合
      > [16,20,22,40,50,55,80,100,110]
      
      -- 嵌套的列表, 在不拆开它的前提下除去其中的所有奇数
      let xxs = [[1,3,5,2,3,1,2,4,5],[1,2,3,4,5,6,7,8,9],[1,2,4,2,1,6,3,1,3,2,3,6]]
      [ [ x | x <- xs, even x ] | xs <- xxs]
      > [[2,2,4],[2,4,6,8],[2,4,2,6,2,6]]
      
       --取得所有三边长度皆为整数且小于等于 10,周长为 24 的直角三角形
      [ (a,b,c) | c <- [1..10], b <- [1..c], a <- [1..b], a^2 + b^2 == c^2, a+b+c == 24]
      > [(6,8,10)]
      

    参考资料

    《HASKELL 趣学指南》
    《Real World Haskell》

    相关文章

      网友评论

        本文标题:Haskell学习-函数式编程初探

        本文链接:https://www.haomeiwen.com/subject/vcgavftx.html