简单理解迭代法

作者: 陨星落云 | 来源:发表于2019-11-21 11:02 被阅读0次

    迭代法(逐次逼近法)
    在线性代数中我们常看到方程组被写为这样的形式:
    Ax=b
    其中A是非奇异矩阵(行列式不等于0)。本科阶段,我们求解的方程组阶数都不高,一般使用主元消去法求解。但对于A的阶数很大,而且零元素很多的大型稀疏矩阵方程组,例如,训练一个包含几十MB乃至几百MB的数据集时,主元消去法就显得力不从心了,而一般要选用逐次逼近法(或称为迭代法)求解。
    为了便于说明,下面我们举一个求解线性方程组的迭代法例子。
    \left\{\begin{array}{l}{8 x_{1}-3 x_{2}+2 x_{3}=20} \\ {4 x_{1}+11 x_{2}-x_{3}=33} \\ {6 x_{1}+3 x_{2}+12 x_{3}=36}\end{array}\right.
    如果记为Ax=b,其中:
    A=\left[\begin{array}{ccc}{8} & {-3} & {2} \\ {4} & {11} & {-1} \\ {6} & {3} & {12}\end{array}\right] \quad x=\left[\begin{array}{c}{x_{1}} \\ {x_{2}} \\ {x_{3}}\end{array}\right] \quad b=\left[\begin{array}{c}{20} \\ {33} \\ {36}\end{array}\right]
    方程组的精确解是:
    x^{*}=(3,2,1)^{\mathrm{T}}
    如果记为另一种形式:
    \left\{\begin{array}{c}{x=B_{0} x+f} \\ {x_{1}=\frac{1}{8}\left(3 x_{2}-2 x_{3}+20\right)} \\ {x_{2}=\frac{1}{11}\left(-4 x_{1}+x_{3}+33\right)} \\ {x_{3}=\frac{1}{12}\left(-6 x_{1}-3 x_{2}+36\right)}\end{array}\right.
    转换为矩阵的形式:
    B_{0}=\left[\begin{array}{ccc}{0} & {\frac{3}{8}} & {\frac{-2}{8}} \\ {\frac{-4}{11}} & {0} & {\frac{1}{11}} \\ {\frac{-6}{12}} & {\frac{-3}{12}} & {0}\end{array}\right] \quad f=\left[\begin{array}{c}{\frac{20}{8}} \\ {\frac{33}{11}} \\ {\frac{36}{12}}\end{array}\right]
    任取初始值,例如取x^{(0)}=(0,0,0)^{\mathrm{T}}。将这些值代入公式(5)右边,即求得方程组的第一次迭代方程组的解,得到新的值。
    x^{(1)}=\left(x_{1}^{(1)}, x_{2}^{(1)}, x_{3}^{(1)}\right)^{\mathrm{T}}=(2.5,3,3)^{\mathrm{T}}
    再将x^{(1)}的分量代入公式(5)右边得到x^{(2)}。反复利用这个计算程序,得到一个向量序列和一般的计算公式(迭代公式)简写为:
    \boldsymbol{x}^{(k+1)}=\boldsymbol{B}_{0} \boldsymbol{x}^{(k)}+\boldsymbol{f}
    其中k为迭代次数(k=0,1,2,...)。
    迭代10次之后得到:
    x^{(10)}=(3.000032,1.999838,0.9998813)^{\mathrm{T}}
    误差向量范数:
    \left\|\varepsilon^{(10)}\right\|_{\infty}=0.000187 \quad\left(\varepsilon^{(10)}=x^{(10)}-x^{*}\right)
    代码实现:

    import numpy as np
    from numpy import linalg
    import matplotlib.pyplot as plt
    
    A = np.mat([[8,-3,2],[4,11,-1],[6,3,12]])
    b = np.mat([20,33,36])
    result = linalg.solve(A,b.T)
    print(result)
    
    # 迭代法
    B0 = np.mat([[0,3/8,-2/8],[-4/11,0,1/11],[-6/12,-3/12,0]])
    f = np.mat([20/8,3,3])
    # x = B0x+f.T
    error = 1.0e-10 # 误差阈值
    steps = 100 # 迭代次数
    xk = np.zeros((3,1)) #初始化值
    errorlist = []
    for k in range(steps):
        xk_1 = xk # 上次的xk
        xk = B0*xk+f.T # 本次的xk
        errorlist.append(linalg.norm(xk-xk_1)) # 计算存储误差
        if errorlist[-1] < error: # 判断误差是否小于阈值
            print(k+1) # 输出迭代次数
            break
    print(xk) #输出结果
    
    # 误差收敛散点图
    plt.plot(range(1,26),errorlist,'o')
    plt.show()
    
    

    输出:

    [[3.]
     [2.]
     [1.]]
    25
    [[3.]
     [2.]
     [1.]]
    
    误差收敛散点图

    摘自:
    《机器学习算法原理与编程实践》

    相关文章

      网友评论

        本文标题:简单理解迭代法

        本文链接:https://www.haomeiwen.com/subject/aobzictx.html