时间复杂度学习(下)

作者: HelloWodee | 来源:发表于2018-12-03 11:08 被阅读0次

复杂度分析（下）笔记：浅析最好、最坏、平均、均摊时间复杂度
时间复杂度学习(下)
算法系列：算法的时间复杂度(Objective-C样例)
时间复杂度(下)
数据结构与算法 - 时空复杂度分析
符号系统
快速排序
数据结构与算法之美（三）复杂度分析（下）
复杂度分析（二）
复杂度分析-下

2018年10月10日

这一节将以一个具体的算法题给出4种不同解法，分析各自的时间复杂度并比较其各自的运行性能。

给出两个求和公式，以下分析中会用到：
$\begin{gather} \sum_{i=1}^Ni=\frac{N(N+1)}{2} \tag{1}\\ \sum_{i=1}^Ni^2=\frac{N(N+1)(2N+1)}{6} \tag{2} \end{gather}$

最大子序列和问题

$A_1, A_2, A_3, ..., A_N$ ，求 $\sum_{k=i}^jA_k$ 的最大值。（为方便起见，若所有整数均为负数，则最大子序列和为0）。

例如：输入 $-2, 11, -4, 13, -5, -2$ ，其最大子序列和为 $11+(-4)+13=20$ 。

1，时间复杂度为 $O(N^3)$ 的解法

    public static int maxSubSum1(int[] a) {
        int maxSum = 0;
        for (int i = 0; i < a.length; i++) {
            for (int j = i; j < a.length; j++) {
                int thisSum = 0;
                for (int k = i; k <= j; k++) {
                    thisSum += a[k];
                }
                if (thisSum > maxSum) {
                    maxSum = thisSum;
                }
            }
        }
        return maxSum;
    }

该种解法最简单暴力，定义子序列的起始位置为i，结束位置为j，假设数组a的长度为N，当 $i=0$ 时， $j=0,1,2,3,...,N-1$ ，共N种情况，当 $i=1$ 时， $j=1,2,3,...,N-1$ ，共N-1种情况，以此类推，当 $i=N-1$ 时， $j=N-1$ ，仅此一种情况；将i与j之间的所有元素和记为thisSum，一旦thisSum的值比maxSum大，就更新maxSum的值为thisSum。

第一个循环大小为N，第二个循环大小为N-i，第三个循环大小为j-i+1，则总运行次数和为：
$\sum_{i=0}^{N-1}\sum_{j=i}^{N-1}\sum_{k=i}^j1$
首先有：
$\sum_{k=i}^j1=j-i+1$
接着：
$\sum_{j=i}^{N-1}(j-i+1)=\frac{(N-i+1)(N-i)}{2}$
那么：
$\begin{align} \sum_{i=0}^{N-1}\frac{(N-i+1)(N-i)}{2} &= \sum_{i=1}^{N}\frac{(N-i+1)(N-i+2)}{2}\\ &=\frac{1}{2}\sum_{i=1}^Ni^2-(N+\frac{3}{2})\sum_{i=1}^Ni +\frac{1}{2}(N^2+3N+2)\sum_{i=1}^N1\\ &=\frac{1}{2}\frac{N(N+1)(2N+1)}{6}-(N+\frac{3}{2})\frac{N(N+1)}{2}+\frac{N^2+3N+2}{2}N\\ &=\frac{N^3+3N^2+2N}{6} \end{align}$

所以该种解法的时间复杂度为 $O(\frac{N^3+3N^2+2N}{6})=O(N^3)$

2，时间复杂度为 $O(N^2)$ 的解法

   public static int maxSubSum2(int[] a) {
       int maxSum = 0;
       for (int i = 0; i < a.length; i++) {
           int thisSum = 0;
           for (int j = i; j < a.length; j++) {
               thisSum += a[j];
               if (thisSum > maxSum) {
                   maxSum = thisSum;
               }
           }
       }
       return maxSum;
   }

在第一种解法中，拿掉最里面的那层循环，并稍做改动，就是现在的解法2。

其中第一层循环大小为N，第二层循环为N-i，则总运行次数为：
$\sum_{i=0}^{N-1}\sum_{j=i}^{N-1}1$
其中：
$\sum_{j=i}^{N-1}1 =N-1-i+1=N-i$
那么：
$\begin{align} \sum_{i=0}^{N-1}(N-i) &= N\sum_{i=0}^{N-1}1-\sum_{i=0}^{N-1}i \\ &= N(N-1+1) - \frac{(N-1)N}{2} \\ &= \frac{N^2-N}{2} \end{align}$
所以第二种解法的时间复杂度为 $O(\frac{N^2-N}{2})=O(N^2)$

3，时间复杂度为 $O(NlogN)$ 的解法

如下图所示，可以将数组分为三部分，分别为前中后三部分。

最大子序列和就可能出现在这三个部分中，其中 $mid=\frac{start+end}{2}=\frac{0+5}{2}=2$ ，前半部分是从start到mid这一部分的元素，即 $-2,11,-4$ ，所以该部分最大元素为11；后半部分是从mid+1到end这一部分的元素，即 $13,-5,-2$ ，所以该部分最大元素为13；而中间部分元素是以mid起始，分别向左和向右进行累加计算，分别求出其向左和向右部分的最大值，从mid向左得到其最大值： $-4+11=7$ ，而向右是从mid+1开始算起得到其最大值： $13$ ，最后将左右两部分和相加即为中间部分的最大值： $7+13=20$ ；比较前中后部分的最大值，发现中间部分的值20最大，所以该数组最大啊子序列和为20。

那么在程序中如何实现呢？这就要采用分治策略，将数组a分为前后两半子数组b,c，再将前半数组b分为前后两半子数组d,e，后半数组c分为前后两半子数组f,g，……，直到数组不能再分为止，此时子数组中就只有一个元素，一个元素就好判断了，该元素为正就直接把该元素值返回给上一级子数组，为负就返回0，然后回到上一级子数组，将之前返回的前后部分子数组的最大值与中间部分最大值进行比较，得出其最大值，接着将最大值返回其上一级子数组，直至回到原数组，这时原数组就得到了前后部分子数组的最大值，接着求出中间部分子数组的最大值并与前后部分进行比较即可得到整个数组的最大子序列和。

$Talk\ is\ cheap,\ show\ code:$

public static int maxSubSum3(int[] a) {
        return a.length > 0 ? maxSumRec(a, 0, a.length - 1) : 0;
    }

    private static int maxSumRec(int[] a, int left, int right) {
        if (left == right) {
            if (a[left] > 0) {
                return a[left];
            } else {
                return 0;
            }
        }

        int center = (left + right) / 2;
        int maxLeftSum = maxSumRec(a, left, center);
        int maxRightSum = maxSumRec(a, center + 1, right);

        int maxLeftBorderSum = 0;
        int leftBorderSum = 0;
        for (int i = center; i >= left; i--) {
            leftBorderSum += a[i];
            if (leftBorderSum > maxLeftBorderSum) {
                maxLeftBorderSum = leftBorderSum;
            }
        }

        int maxRightBorderSum = 0;
        int rightBorderSum = 0;
        for (int i = center + 1; i <= right; i++) {
            rightBorderSum += a[i];
            if (rightBorderSum > maxRightBorderSum) {
                maxRightBorderSum = rightBorderSum;
            }
        }

        return max3(maxLeftSum, maxRightSum,
                maxLeftBorderSum + maxRightBorderSum);
    }

    private static int max3(int a, int b, int c) {
        return a > b ? a > c ? a : c : b > c ? b : c;
    }

其中center为数组中间元素的下标，maxLeftSum和maxRightSum分别为数组前后部分的最大值，maxLeftBorderSum为中间部分向左计算的最大值，maxRightBorderSum为中间部分向右计算最大值；maxLeftBorderSum + maxRightBorderSum即为中间部分的最大值。

计算中间部分，即计算maxLeftBorderSum和maxRightBorderSum总花费时间为 $N$ ，而计算前后两半部分，即maxLeftSum和maxRightSum每个花费 $T(N/2)$ 个时间单元，则总共花费时间：
$T(N)=2T(N/2)+N$
其中 $T(1)=1$ ，则 $T(2)=4=2*2$ ， $T(4)=12=4*3$ ， $T(8)=32=8*4$ ， $T(16)=80=16*5$ 。

那么当 $N=2^k$ ，则 $T(N)=N*(k+1)=N(logN+1)$ ，忽略低阶项，所以该方法的时间复杂度为： $O(NlogN)$ 。

4，时间复杂度为 $O(N)$ 的解法

public static int maxSubSum4(int[] a) {
        int maxSum = 0;
        int thisSum = 0;

        for (int i = 0; i < a.length; i++) {
            thisSum += a[i];

            if (thisSum > maxSum) {
                maxSum = thisSum;
            } else if (thisSum < 0) {
                thisSum = 0;
            }
        }

        return maxSum;
    }

此种方法将时间复杂度优化到了 $O(N)$ ，只需一轮循环即可找到最大子序列；其思路为：若当前子序列的和thisSum为负数，则将thisSum置为0，下一个数组元素作为新的子序列的起始位置，thisSum从该元素开始累加，直至找到最大子序列的和。

5，对比分析

使用下面代码测试上述4中解法所消耗的时间：

public static void getTimingInfo(int n, int alg) {
        int[] test = new int[n];
        Random rand = new Random();

        long startTime = System.currentTimeMillis();
        long totalTime = 0;

        int i;
        for (i = 0; totalTime < 4000; i++) {
            for (int j = 0; j < test.length; j++) {
                test[j] = rand.nextInt(100) - 50;
            }
            switch (alg) {
                case 1:
                    maxSubSum1(test);
                    break;
                case 2:
                    maxSubSum2(test);
                    break;
                case 3:
                    maxSubSum3(test);
                    break;
                case 4:
                    maxSubSum4(test);
                    break;
                default:
            }

            totalTime = System.currentTimeMillis() - startTime;
        }
        System.out.print(String.format("\t%12.6f",
                (totalTime * 1000 / i) / (double) 1000000));
    }

    public static void main(String[] args) {
        for (int n = 100; n <= 1000000; n *= 10) {
            System.out.print(String.format("N = %7d", n));

            for (int alg = 1; alg <= 4; alg++) {
                if ((alg == 1 && n > 50000) || (alg == 2 && n > 500000)) {
                    System.out.print("\t      NA    ");
                    continue;
                }
                getTimingInfo(n, alg);
            }
            System.out.println();
        }
    }

运行结果如下图，当预测时间过长，将其设为NA，从图中可以看出，不同时间复杂度的程序虽然得出的结果是一样的，但运行性能相差巨大，犹如波音与摩拜的差别。

总结：以后写代码之前要多思考，避免一上来就暴力求解，造成巨大的性能开销，应尽量将程序优化到线性阶或线性对数阶以内。

复杂度分析（下）笔记：浅析最好、最坏、平均、均摊时间复杂度
复杂度分析（下）笔记：浅析最好、最坏、平均、均摊时间复杂度最好时间复杂度和最坏时间复杂度在渐近符号学习中已经...
时间复杂度学习(下)
2018年10月10日这一节将以一个具体的算法题给出4种不同解法，分析各自的时间复杂度并比较其各自的运行性能。 ...
算法系列：算法的时间复杂度(Objective-C样例)
用这篇博客记录一下学习如何计算时间复杂度的过程。本文会从时间复杂度的定义到具体案例的练习，让初学者对时间复杂度有个...
时间复杂度(下)
时间复杂度知识点最好时间复杂度最坏时间复杂度平均情况复杂度均摊时间复杂度
数据结构与算法 - 时空复杂度分析
这周主要总结了时间复杂度的学习，跟小伙伴们分享下，欢迎指正。一、为何需要分析算法复杂度挺多同学本科都学习过数据...
符号系统
学习算法之前，先介绍统一一下衡量算法复杂度的符号系统，尤其时间复杂度： O (<=)，f(n) = O(g(n))...
快速排序
平均时间复杂度：O(nlogn)最坏时间复杂度：O(n^2) （极少情况下会出现）最优时间复杂度：O(nlogn)...
数据结构与算法之美（三）复杂度分析（下）
04 | 复杂度分析（下）：浅析最好、最坏、平均、均摊时间复杂度最好情况时间复杂度（best case time...
复杂度分析（二）
一、复杂度分析的4个概念最坏情况时间复杂度：代码在最理想情况下执行的时间复杂度。最好情况时间复杂度：代码在最坏...
复杂度分析-下
复杂度分析的四个概念 1.最坏情况时间复杂度代码在最理想情况下执行的时间复杂度。 2.最好情况时间复杂度 ...