3-玩转数据结构-栈和队列

作者: 天涯明月笙 | 来源:发表于2018-08-11 13:29 被阅读151次

我们会介绍两个全新的线性数据结构，栈与队列。

栈Stack

栈也是一种线性结构;相比数组，栈对应的操作是数组的子集;只能从一端添加元素，也只能从一端取出元素(这一端称之为栈顶)

添加元素和取出元素都只能从栈顶位置开始存取。栈是一种后进先出的数据结构。Last ln First Out (LIFO);
在计算机的世界里，栈拥有着不可思议的作用

栈的应用: 无处不在的Undo操作(撤销)

比如你打字: 沉迷学习无法自拔，然后将无法打成不法。

撤销就是将这个不法出栈，然后将后续的正确字都入栈。

程序调用的系统栈(对于理解递归有作用)

函数A运行到一半，调用函数B; B运行到一半，调用函数C;

A2指函数A运行到了第二行，B2指函数B运行到了第二行。当函数C顺序执行完毕之后，该执行哪一个函数呢，拿出栈顶B2继续执行。
当B函数执行完毕之后，拿出栈顶A2，执行A函数，执行完之后，发现栈为空，整个程序执行完毕。

子过程，子逻辑的调用，对于理解递归有作用。

栈的实现

Stack<E>
void push(E e);      // 向栈中加入元素
E pop();           // 弹出栈顶元素
E peek( );         // 查看栈顶元素
int getSize();     // 获取栈中元素个数
boolean isEmpty(); // 判断栈是否为空

从用户的角度看，支持这些操作就好。具体底层实现，用户不关心，实际底层有多种实现方式。

    Interface Stack<E> implement ArrayStack<E>
    int getSize();
    boolean isEmpty();
    void push(E e);
    E pop();
    E peek();

将我们栈中的常用方法作为一个接口，然后让我们上次实现的动态数组来实现这个接口。

    /**
     * 获取数组最后一个元素(方便我们的栈实现)
     * 
     * @return
     */
    public E getLast(){
        return  get(size-1);
    }

    /**
     * 获取数组第一个元素
     * 
     * @return
     */
    public E getFirst(){
        return get(0);
    }

为Array添加两个方法方便我们的栈实现。

package cn.mtianyan;

public class ArrayStack<E> implements Stack<E> {
    Array<E> array;
    public ArrayStack(int capacity){
        array = new Array<>(capacity);
    }

    public ArrayStack() {
        array = new Array<>();
    }

    public int getCapacity(){
        return array.getCapacity();
    }


    @Override
    public int getSize() {
        return array.getSize();
    }

    @Override
    public boolean isEmpty() {
        return array.isEmpty();
    }


    @Override
    public void push(E e) {
        array.addLast(e);
    }

    @Override
    public E pop() {
        return  array.removeLast();
    }

    @Override
    public E peek() {
        return array.getLast();
    }

    @Override
    public String toString() {
        StringBuilder res = new StringBuilder();
        res.append("Stack ：");
        res.append("[ ");
        for (int i = 0; i < array.getSize(); i++) {
            res.append(array.get(i));
            if (i != array.getSize()-1){
                res.append(", ");
            }
        }
        res.append("] top");
        return  res.toString();
    }

}

栈的设计中，用户只关注栈顶元素存取和栈长度。因此不需要提供其他对外方法。

package cn.mtianyan;

public class ArrayStackTest {


    public static void main(String[] args) {
        ArrayStack<Integer> arrayStack = new ArrayStack<>();
        for (int i = 0; i < 5; i++) {
            arrayStack.push(i);
            System.out.println(arrayStack);
        }
        arrayStack.pop();
        System.out.println(arrayStack);
    }

}

运行结果:

栈的复杂度分析

ArrayStack<E>
void push(E e)      // O(1) 均摊
E pop()             // O(1) 均摊
E peek()            // O(1)
int getSize()       // O(1)
boolean isEmpty()   // O(1)

这里的push和pop操作在最后面进行，有可能触发resize，但均摊来算是O(1)的。

栈的应用

undo操作-编辑器; 系统调用栈-操作系统;

应用: 括号匹配 - 编译器 LeetCode 问题(leetcode-cn.com) 美版的功能更丰富

https://leetcode-cn.com/problems/valid-parentheses/description/

许多公司真实的面试题。

栈顶元素反映了在嵌套的层次关系中，最近的需要匹配的元素

只要是左侧的括号，就压入栈内。

如上图所示，只要是左侧就压入栈。面对字符时右括号，开始查看当前栈顶元素是否可以和该右括号匹配，匹配则出栈。

直到所有字符扫描完毕，栈为空则匹配成功。

失败的例子:

左侧括号全部入栈后，遇到的右括号无法和栈顶匹配,匹配失败。Leetcode会生成相应的语言的答题模板

class Solution {
    public boolean isValid(String s) {
        
    }
}

这一小节我们使用import java.util.Stack;,但实际我们自己编写的Stack和java中的这个接口是一致的，下节课教大家在LeetCode用我们自己编写的Stack。

package cn.mtianyan;

import java.util.Stack;

class Solution {
    public boolean isValid(String s) {
        Stack<Character> stack = new Stack<>();
        for (int i = 0; i < s.length(); i++) {
            char c = s.charAt(i); // String中的第i个字符
            if (c == '(' || c == '[' || c == '{'){
                stack.push(c);
            }else{
                if (stack.isEmpty())
                    return false;
                char topChar = stack.pop();
                if (c ==')' && topChar !='(')
                    return false;
                if (c ==']' && topChar !='[')
                    return false;
                if (c=='}' && topChar != '{')
                    return false;
            }
        }
        return stack.isEmpty();
    }
}

注意topChar时的pop操作，完成了取出栈顶元素和保存栈顶元素两个操作。

附加Python版本实现:

class Solution:
    def isValid(self, s):
        """
        :type s: str
        :rtype: bool
        """
        stack = []
        for c in s:
            if(c=='(' or c=='[' or c=='{'):
                stack.append(c)
            else:
                if(len(stack) == 0):
                    return False
                top_c = stack.pop()
                if (c ==')' and top_c != '('):
                    return False
                if (c ==']' and top_c !='['):
                    return False
                if (c=='}' and top_c != '{'):
                    return False
        return len(stack)==0;

if __name__ == '__main__':
    s = Solution()
    print(s.isValid("(]"))

Python版实现要注意list没有push方法，应该使用append方法代替; 注意栈为空(没有待匹配字符直接return False) Python中False是大写，python中获取长度使用len()方法。pop方法还是一样的。

关于LeetCode的更多说明

本地测试,Java版直接添加main函数

public static void main(String[] args) {
        System.out.println(new Solution().isValid("()[]{}"));
        System.out.println(new Solution().isValid("([)]"));
    }

运行结果:

提交时即使添加了main函数也不会报错的。但是请注意不要将自己Package的语句也加入，会报错。

方法必须是public的，因为它会在类外创建自己的Main使用你的方法。

如果我们本地有自己的类接口等，我们可以通过内部类(可以使public也可以是private)来在LeetCode上使用。

class Stack(object):
    """栈"""

    def __init__(self):
        self.items = []

    def is_empty(self):
        """判断是否为空"""
        return self.items == []

    def push(self, item):
        """加入元素"""
        self.items.append(item)

    def pop(self):
        """弹出栈顶元素"""
        return self.items.pop()

    def peek(self):
        """返回栈顶元素"""
        return self.items[len(self.items) - 1]

    def size(self):
        """返回栈的大小"""
        return len(self.items)


class Solution:
    def isValid(self, s):
        """
        :type s: str
        :rtype: bool
        """
        stack = Stack()
        for c in s:
            if c == '(' or c == '[' or c == '{':
                stack.push(c)
            else:
                if stack.size() == 0:
                    return False
                top_c = stack.pop()
                if c == ')' and top_c != '(':
                    return False
                if c == ']' and top_c != '[':
                    return False
                if c == '}' and top_c != '{':
                    return False
        return stack.size() == 0


if __name__ == '__main__':
    s = Solution()
    print(s.isValid("(]"))
    print(s.isValid("()"))

Python中不能使用内部类，而是应该该类与class Solution并列。这种提交方式，既可以检验我们的解题，对于我们自己编写的Array Stack也进行检验，值得推荐。

可以看到LeetCode的相关话题。点击可以找到栈相关的题目，可以进行专项练习。

学习方法的疑问:

强烈推荐bobo老师的学习方法指导: https://zhuanlan.zhihu.com/p/35878826

一个课程知识学好几遍，而不是硬扛着一遍强行看完。不懂的先留着，比如我就有一个自己的胡思乱想笔记，记录自己每个阶段遗留问题，日后这些遗留问题在自己学到更深度的知识的时候自然会解决。

这39个问题看看自己感兴趣的，大概了解一下栈能解决什么问题。不是非得把问题做完，才能开始下一节。

不要完美主义。掌握好“度”;学习本着自己的目标去。

对于这个课程，大家的首要目标，是了解各个数据结构的底层实现原理,以及应用。学习到后面，再回头来看。

队列 Queue

队列也是一种线性数据结构; 相比数组，队列对应的操作是数组的子集

只能从一端 (队尾) 添加元素，只能从另一端 (队首) 取出元素

就像一个银行的柜台，从队尾进入元素，在队首有柜台处理，处理了就可以出队。

出队从队首出队，1然后2。

队列是一种先进先出的数据结构(先到先得); First In First Out (FIFO)

Queue<E>
void enqueue(E e); // 入队
E dequeue();       // 出队
E getFront();      // 获取队首元素
int getSize();      // 获取队列元素多少
boolean isEmpty();  // 是否为空

Interface Queue<E> implement ArrayQueue<E>
void enqueue(E e); // 入队
E dequeue();       // 出队
E getFront();      // 获取队首元素
int getSize();      // 获取队列元素多少
boolean isEmpty();  // 是否为空

package cn.mtianyan;

public interface Queue<E> {
    void enqueue(E e); // 入队
    E dequeue();       // 出队
    E getFront();      // 获取队首元素
    int getSize();      // 获取队列元素多少
    boolean isEmpty();  // 是否为空
}

package cn.mtianyan;

public class ArrayQueue<E> implements Queue<E> {
    private Array<E> array;

    public ArrayQueue(int capacity) {
        this.array = new Array<>(capacity);
    }

    public ArrayQueue() {
        this.array = new Array<>();
    }

    public int getCapacity(){
        return array.getCapacity();
    }

    @Override
    public void enqueue(E e) {
        array.addLast(e);
    }

    @Override
    public E dequeue() {
        return array.removeFirst();
    }

    /**
     * 获取队首元素
     *
     * @return
     */
    @Override
    public E getFront() {
        return array.getFirst();
    }

    @Override
    public int getSize() {
        return array.getSize();
    }

    @Override
    public boolean isEmpty() {
        return array.isEmpty();
    }

    @Override
    public String toString() {
        StringBuilder res = new StringBuilder();
        res.append("Queue ：");
        res.append("front [ ");
        for (int i = 0; i < array.getSize(); i++) {
            res.append(array.get(i));
            if (i != array.getSize()-1){
                res.append(", ");
            }
        }
        res.append("] tail");
        return  res.toString();
    }

    public static void main(String[] args) {
        ArrayQueue<Integer> queue = new ArrayQueue<>();
        for (int i = 0; i < 5; i++) {
            queue.enqueue(i);
            System.out.println(queue);
        }
        queue.dequeue();
        System.out.println(queue);
    }
}

运行结果:

数组队列的复杂度分析

ArrayQueue<E>

void enqueue(E e); // 入队 O(1) 均摊
E dequeue();       // 出队 O(n)
E getFront();      // 获取队首元素 O(1)
int getSize();      // 获取队列元素多少 O(1)
boolean isEmpty();  // 是否为空 O(1)

这里入队是从队尾，有可能触发resize，因此均摊下来是O(1)。出队是在队首，数组实现每次都要挪动所有元素,O(n)。

获取队首元素，get(0)，O(1)。剩下两个也是常数级别完成，O(1); 使用循环队列实现即可。

可不可以在把a删除之后，不挪动bcde呢？

剩下的元素仍然保持着先后顺序，我们可以记录一下当前的队首是谁？

(front++)就可以了，tail位置不用变。

front == tail 队列为空。只要队列不为空，front 就不可能等于 tail

入队时不需要考虑front，只需要tail++;出队时，tail不变，front++就可以了。

当tail指向队尾末，再++就会移到越界区域时，前面还有空余空间，把元素填充到前面去。

把数组看成一个环，容量是8，索引0-7。当指向7之后的位置，就变成0了，tail = (7+1)%8 即可。

此时如果再放入元素，tail往后移，front = tail 了，但此时队列为满。

front == tail 队列为空; tail+ 1==front 队列满; 此时就可以扩容了。准确的是(tail +1)%capacity == front队列满

对于整个的capacity中，故意的浪费了一个空间。循环队列类似于钟表时针转动到12.

循环队列代码的基本实现

package cn.mtianyan;

import java.util.Arrays;

public class LoopQueue<E> implements Queue<E> {

    private E[] data;
    private int front, tail; // 队首和下一个空位置索引
    private int size;        // 可以没有size，自己尝试

    public LoopQueue(int capacity) {
        data = (E[]) new Object[capacity+1]; // 因为会有一个浪费
        front = 0;
        tail = 0;
        size = 0;
    }

    public LoopQueue() {
        this(10);
    }

    public int getCapacity(){
        return data.length-1;
    }

    @Override
    public void enqueue(E e) {
        if (isFull()){
            resize(getCapacity()*2);
        }
        data[tail] = e;
        tail = (tail+1) % data.length;
        size++;
    }

    private void resize(int newCapacity) {
        E[] newData = (E[]) new Object[newCapacity +1];
        for (int i = 0; i < size; i++) {
            newData[i] = data[(i+front) % data.length]; // 此时在newData中队首对齐回来，data中就得有一个front的偏移量
        }
        data = newData;
        front = 0;
        tail = size;
    }

    @Override
    public E dequeue() {
       if (isEmpty()){
           throw new IllegalArgumentException("Cannot dequeue from an empty queue");
       }
       E ret = data[front];
       data[front] = null;
       front = (front+1) % data.length;
       size--;
       if(size == getCapacity()/4 && getCapacity()/2 != 0){
           resize(getCapacity()/2);
       }
       return ret;
    }

    @Override
    public E getFront() {
        if (isEmpty()){
            throw new IllegalArgumentException("Cannot dequeue from an empty queue");
        }
        return data[front];
    }

    @Override
    public int getSize() {
        return size;
    }

    @Override
    public boolean isEmpty() {
        return front == tail;
    }
    public boolean isFull(){
        return (tail +1)%data.length ==front; // 下一个tail指向front
    }

    @Override
    public String toString() {
        StringBuilder res = new StringBuilder();
        res.append(String.format("LoopQueue: size = %d, capacity = %d\n",size,getCapacity()));
        res.append("front [");
        for (int i = front; i != tail; i = (i+1)%data.length) {
            res.append(data[i]);
            if ((i+1)%data.length !=tail) // 最后一个元素不要加，
                res.append(", ");
        }
        res.append("] tail");
        return res.toString();
    }
    public static void main(String[] args) {
        LoopQueue<Integer> queue = new LoopQueue<>();
        for (int i = 0; i < 5; i++) {
            queue.enqueue(i);
            System.out.println(queue);
            if(i %3 == 2){
                queue.dequeue();
                System.out.println(queue);
            }
        }
    }
}

运行结果:

这里的resize和toString中我们使用了两种不同的遍历方式。一种是size次，元素取值时index偏移量;一种是头不等于尾，i按照循环取值规则向后++。

用户在使用数据结构时，只需要了解接口中设计的方法，其他内部实现对于用户进行了隐藏，比如内部的capacity+1等操作。

循环队列的出队复杂度也变成了O(1),具体的性能对比我们下一节来对比。

循环队列的复杂度分析

ArrayQueue<E>

void enqueue(E e); // 入队 O(1) 均摊
E dequeue();       // 出队 O(1) 均摊
E getFront();      // 获取队首元素 O(1)
int getSize();      // 获取队列元素多少 O(1)
boolean isEmpty();  // 是否为空 O(1)

出队操作可能触发缩容。具体O(n)比O(1)慢多少。

对10万个元素入队出队看时间。

package cn.mtianyan;

import java.util.Random;

public class Main {
    /**
     * 测试使用q运行optCount个enqueue和deQueue操作所需时间。单位: 秒
     *
     * @param q
     * @param opCount
     * @return
     */
    private static double testQueue(Queue<Integer> q,int opCount){
        long startTime = System.nanoTime();

        Random random = new Random();

        for (int i = 0; i < opCount; i++) {
            q.enqueue(random.nextInt(Integer.MAX_VALUE)); // 生成从0到int最大值
        }
        for (int i = 0; i < opCount; i++) {
            q.dequeue();
        }

        long endTime = System.nanoTime(); // 纳秒

        return (endTime - startTime)/ 1e9;
    }

    public static void main(String[] args) {
        int opCount = 100000;
        ArrayQueue<Integer> arrayQueue = new ArrayQueue<>();
        double time1 = testQueue(arrayQueue, opCount);
        System.out.println("ArrayQueue出队入队"+opCount+"次的时间: "+time1+"秒");
        LoopQueue<Integer> loopQueue = new LoopQueue<>();
        double time2 = testQueue(loopQueue, opCount);
        System.out.println("loopQueue出队入队"+opCount+"次的时间: "+time2+"秒");
    }
}

运行结果:

对于100万的运行结果:

两者的差距主要在出队的过程中。对于ArrayQueue来说，每出一次队，队首后面的所有元素都得挪动一次。出队操作复杂度是O(n),相应而言，对于ArrayQ，整个testQueue的复杂度就是O(n^2)，因为每次O(n)，for循环有n次。对于LoopQueue的testQueue: 每次都是O(1)，for循环有n次，因此testQueue()为O(n)。

性能对比:

Queue类型	循环次数	时间	倍数
LoopQueue	10万	0.01	1(基准)
ArrayQueue	10万	2.85	285
LoopQueue	100万	0.06	1(基准)
ArrayQueue	100万	285.46	4758

这是对于O(n)以及O(n^2) 的性能对比，可以看出性能差异巨大。对于同一种Queue实现，我们依然可以根据(0.06/0.01)=6 数据量扩大十倍，时间复杂度扩大了6倍,验证O(n); (285.46/2.85)=100，数据量扩大10倍，时间复杂度扩大了100倍，验证O(n^2)。

更合理的测试方法是对于testQueue也进行多次，取平均值。和JVM也会有关。

同一台电脑，我改为java10运行。不知为什么比java8的运行速度慢了很多。

队列的应用: 排队，操作系统任务排队。队首的定义，存在广义队列，后面会学。此处我们学到的普通队列，在后面的广度优先遍历，二叉树时也可以学到。

下一章，我们将讲解链表。

3-玩转数据结构-栈和队列

栈Stack

栈的实现

栈的复杂度分析

栈的应用

关于LeetCode的更多说明

学习方法的疑问:

队列 Queue

数组队列的复杂度分析

循环队列代码的基本实现

循环队列的复杂度分析

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

程序员

编程笔记

互联网科技

Go系统与并发

慕课网实战学习笔记