2-玩转数据结构-不要小瞧数组

作者: 天涯明月笙 | 来源:发表于2018-08-10 20:01 被阅读151次

2-玩转数据结构-不要小瞧数组
数据结构之数组
诗（125）不要小瞧
数据结构1-数组_不要小瞧数组_冒泡、选择、插入、归并、快速、随
数据结构：数组
第二章不要小瞧数组
不要小瞧
数据结构和算法-2-数组
数据结构和算法-2-数组
【第一周】3.将两个按值有序的非空数组合并为一个按值有序的数组

我们要学习的第一个数据结构就是数组，数组中很多值得挖掘。

数组基础

把数据码成一排进行存放

数组中索引从0开始，Java语法中要求数组存放同一类型的元素，可以通过中括号下标的方式取到元素。

这样可以看到Main中有的方法。

package cn.mtianyan;

public class Main {

    public static void main(String[] args) {
        // 必须传入长度
        int[] arr = new int[10];
        for (int i = 0; i < arr.length; i++) {
            arr[i] = i;
        }

        System.out.println("=========");

        int[] scores = new int[]{100,99,96};
        for (int i = 0; i < scores.length; i++) {
            System.out.println(scores[i]);
        }

        System.out.println("=========");

        for (int score : scores) {
            System.out.println(score);
        }

        System.out.println("=========");
        scores[0] = 92;

        for (int score : scores) {
            System.out.println(score);
        }
    }
}

运行结果：

数组可以这样遍历，是因为它实现了可遍历接口。

Java为我们提供的数组，其中非常重要的一部分就是它的索引。索引可以有语义，也可以没有语义,2可以代表学号，但也可以将其视为没有语义。

数组最大的优点: 快速查询，scores[2]直接插到2号索引的。因此数组最好应用于"索引有语义"的情况，查学号为2的学生成绩。

但并非所有有语意的索弓都适用于数组,如身份证号: 1101031985121 66666;依次为索引，这得开辟很大的内存空间,空间浪费。

数组也可以处理“索引没有语意”的情况。我们在这一章，主要处理“索引没有语意”的情况数组的使用。

索引没有语意，如何表示没有元素? capacity 和 size的区别：数组size是3，capacity是8。

如何添加元素（超过size如何处理）?如何删除元素（挪位）? Java中的数组并没有这些方法，我们需要基于java的数组，二次封装属于我们自己的数组类。

我们自己做的是动态数组（内部依然使用java数组实现），Java的是静态数组。

增删改查，有的数据结构不一定四个齐全。capacity是数组最多可以装多少元素，和实际能装多少元素是没有关系的。

package cn.mtianyan;

public class Array {
    private int[] data;
    private int size;

    /**
     * 带容量参数构造函数
     *
     * @param capacity 数组容量
     */
    public Array(int capacity) {
        data = new int[capacity];
        size = 0;
    }

    /**
     * 默认构造函数
     */
    public Array() {
        this(10);
    }

    /**
     * 静态数组入参构造函数
     *
     * @param data 传入静态数组
     */
    public Array(int[] data) {
        this.data = data;
    }

    /**
     * 获取数组元素个数
     *
     * @return size 数组元素个数
     */
    public int getSize() {
        return size;
    }

    /**
     * 获取数组的容量
     *
     * @return capacity 获取容量
     */
    public int getCapacity(){
        return data.length;
    }

    /**
     * 判断数组是否为空
     *
     * @return 是否为空
     */
    public boolean isEmpty(){
        return size == 0;
    }
}

向数组中添加元素

向数组末尾添加元素

size指向data中第一个为空位置。因此添加元素时只需要添加到arr[size],并size++即可。(注意添加元素判满)

    /**
     * 向所有元素末尾添加一个新元素。
     *
     * @param e 添加的元素
     */
    public void addLast(int e){
//        if (isFull()){
//            throw new IllegalArgumentException("AddLast failed. Array is Full");
//        }else {
//            data[size] =e; // data[size++] =e;
//            size++;
//        }
        add(size,e);
    }

    /**
     * 向索引0号位置添加元素
     *
     * @param e 添加的元素
     */
    public void addFirst(int e){
        add(0,e);
    }

    /**
     * 在index位置插入一个新元素e
     *
     * @param index 插入位置索引
     * @param e 插入元素
     */
    public void add(int index,int e){
        if (isFull())
            throw new IllegalArgumentException("AddLast failed. Array is Full");
        // 大于size就不是紧密排列了
        if (index<0 || index>size){
            throw new IllegalArgumentException("AddLast failed. Required index<0 or index>size ");
        }
        else {
            // 从哪开始挪呢: 从size-1这个元素(size本身是指向空的),挪到哪个呢，index位置的这个元素也是要挪的。
            for (int i=size-1; i>=index; i--){
                data[i+1] = data[i]; // 后一个等于前一个，从数组最后一个元素开始。
                // 极端值验证: size 1 index 0;(i=0;i>=0;i--)会执行一次data[1]=data[0].正确。
            }
            data[index] = e;
            size++;
        }
    }

77插入，后面的元素都要向后挪动。

这里注意必须从100这里，向后挪，否则会造成值覆盖。

在数组中查询元素和修改元素

    /**
     * 打印数组信息及遍历元素。
     *
     * @return 数组信息和元素遍历结果
     */
    @Override
    public String toString() {
        StringBuilder res = new StringBuilder();
        res.append(String.format("Array: size = %d, capacity = %d\n",size,data.length));
        res.append('[');
        for (int i = 0; i < size; i++) {
            res.append(data[i]);
            if (i !=size-1) // 最后一个元素不要加，
                res.append(", ");
        }
        res.append(']');
        return res.toString();
    }

package cn.mtianyan;

public class ArrayTest {
    public static void main(String[] args) {
        Array array = new Array(20);
        for (int i = 0; i < 10; i++) {
            array.addLast(i);
        }
        System.out.println(array);
    }
}

运行结果:

        array.add(1,100);
        System.out.println(array);

运行结果:

        array.addFirst(-1);
        System.out.println(array);

运行结果:

取出某一个元素。

    /**
     * 传入索引，获取该位置元素
     *
     * @param index 要获取的元素索引
     * @return 返回该位置数组元素
     */
    public int get(int index){
        if (index<0 || index>=size){
            throw new IllegalArgumentException("Get failed. Required index<0 or index>=size ");
        }else {
            return data[index];
        }
    }

通过get方法用户无法使用到数组后半截没有使用到的空间，通过封装保证。

System.out.println(array.get(array.getSize()-1));

运行结果:

    /**
     * 传入索引和元素值，将该位置元素设置为传入值
     * @param index 索引
     * @param e 传入值
     */
    public void set(int index,int e){
        if (index<0 || index>=size){
            throw new IllegalArgumentException("Set failed. Required index<0 or index>=size ");
        }else {
            data[index] = e;
        }
    }

        array.set(0,-99);
        System.out.println(array);

运行结果:

数组中的包含，搜索和删除元素

如果要删除索引为1的元素，从88开始，后面都要往前挪,挪size-index次。只需要size--，对于最后一个位置的元素不用做其他操作，因为用户也访问不到。

/**
     * 查找数组中是否有元素e
     *
     * @param e
     * @return 包含 true; 不包含 false
     */
    public boolean contains(int e){
        for (int i = 0; i < size; i++) {
            if (data[i] == e){
                return true;
            }
        }
        return false;
    }

    /**
     * 查找数组中元素，返回其索引(第一个遇到)
     *
     * @param e 元素
     * @return 不存在 -1; 存在 i
     */
    public int find(int e){
        for (int i = 0; i < size; i++) {
            if (data[i] == e){
                return i;
            }
        }
        return -1;
    }

    public int[] findAll(int e){
        int[] tempArray=new int[size];
        int index = 0;
        for (int i = 0; i < size; i++) {
            if (data[i] == e){
                tempArray[index] = i;
                index++;
            }
        }
        int[] indexArray=new int[index];
        for (int i = 0; i < index; i++) {
            indexArray[i] = tempArray[i];
        }
        return indexArray;
    }

注意findAll中使用tempArray临时对象的作用: 同时将int数组，与它的size一起传递了出来。

        System.out.println("===============加入重复元素后数组如下===================");
        array.add(3,3);
        array.add(array.getSize()-1,9);
        System.out.println(array);
        System.out.println("================包含 寻找测试===========================");
        System.out.println(array.contains(-99));
        System.out.println(array.contains(-100));
        System.out.println("3的index: "+array.find(3));
        int [] tmpArr = array.findAll(3);
        for (int i : tmpArr) {
            System.out.print(i+" ");
        }
        System.out.println();

运行结果:

 /**
     * 删除数组元素，返回删除的元素值
     *
     * @param index 索引
     * @return 该索引位置元素值
     */
    public int remove(int index){
        // 判空，空数组 removeFirst index=0,size=0，index>=size异常。空数组 removeLast index=-1 index<0异常;
        if (index<0 || index>=size){
            throw new IllegalArgumentException("Remove failed. Required index<0 or index>=size ");
        }else {
            int ret = data[index];
            for (int i=index+1;i < size;i++){
                // 从哪个元素开始挪，从index位置的后一个元素开始，挪到哪个元素结束，挪到size-1(因此没等号)
                data[i-1] = data[i]; // 前一个等于后一个
            }
            size--;
            return ret;
        }
    }

    /**
     * 删除第一个(索引0)元素
     *
     * @return 删除的元素值
     */
    public int removeFirst(){
        return  remove(0);
    }

    /**
     * 删除最后一个(索引size-1)元素
     *
     * @return 删除的元素值
     */
    public int removeLast(){
        return remove(size-1);
    }

    /**
     * 删除数组中某一个元素值（删除数组中第一个找到的）
     *
     * @param e 元素值
     * @return 删除是否成功
     */
    public boolean removeElement(int e){
        int index = find(e);
        if (index != -1){
            remove(index);
            return true;
        }
        return false;
    }

    /**
     * 删除数组中包含的所有该元素值
     * @param e 元素值
     * @return 删除成功与否
     */
    public boolean removeAllElement(int e){
        int[] indexArray = findAll(e);
        if (indexArray.length != 0){
            for (int i = 0; i < indexArray.length; i++) {
                remove(indexArray[i]-i); // 此处注意-i的巧妙
            }
            return true;
        }
        return false;
    }

重难点代码在于remove(indexArray[i]-i);此处很可能会被忽略，造成异常。因为数组每删除一个，原本获取到的临近后一个元素的index值应该-1；临近后两个则应该-2；以此类推。

        System.out.println("================开始删除测试========================");
        System.out.println(array);
        array.remove(3); // 删除一个3
        System.out.println(array);
        array.removeElement(1); // 删除1
        System.out.println(array);
        System.out.println("=====删除index3 后 删除元素1如上====");

运行结果:

        array.removeAllElement(9);
        System.out.println(array);
        System.out.println("=====删除所有9=====");
        array.addFirst(-99);
        array.removeAllElement(-99);
        System.out.println(array);
        System.out.println("=====首位添加-99，后删除所有-99 结果如上=====");

        array.add(4,99);
        array.add(5,99);
        array.addFirst(99);
        array.addLast(99);
        array.add(7,99);
        System.out.println(array);
        System.out.println("=====上面为删除99前，下面为删除99后=====");
        array.removeAllElement(99);
        System.out.println(array);

使用泛型

我们上面实现的数组目前只能存放int类型，但是我们需要的是可以承载多种类型，甚至自定义对象的容器。Java泛型可以解决这个问题。

使用泛型: 让我们的数据结构可以放置“任何”数据类型,不可以是基本数据类型，只能是类对象。

java中的八种基本类型: boolean , byte, char , short , int , long , float , double;

每个基本数据类型都有对应的包装类: Boolean , Byte , Char , Short, Int , Long , Float , Double。自动的拆包，解包。

public class Array<Element>
public class Array<E>

为类名后面添加泛型类型标识，此处的类型标识可以自定义。

    private E[] data;

这里无法直接通过E实例化。只能通过间接的Object再转换。

data = (E[]) new Object[capacity];

    /**
     * 静态数组入参构造函数
     *
     * @param data 传入静态数组
     */
    public Array(E[] data) {
        this.data = data;
    }

public void add(int index,E e){
public void addLast(E e){
public void addFirst(E e){

 public boolean contains(int E){
        for (int i = 0; i < size; i++) {
            if (data[i].equals(E)){
                return true;
            }
        }
        return false;
    }

这里注意，两个对象之间的比较要使用equals方法，将所有的与成员数组类型相关的都改了。

    public E remove(int index){
        // 判空，空数组 removeFirst index=0,size=0，index>=size异常。空数组 removeLast index=-1 index<0异常;
        if (index<0 || index>=size){
            throw new IllegalArgumentException("Remove failed. Required index<0 or index>=size ");
        }else {
            E ret = data[index];
            for (int i=index+1;i < size;i++){
                // 从哪个元素开始挪，从index位置的后一个元素开始，挪到哪个元素结束，挪到size-1(因此没等号)
                data[i-1] = data[i]; // 前一个等于后一个
            }
            size--;
            data[size] = null;
            return ret;
        }
    }

data[size]还指着一个值不过用户访问不到而已，新的元素添加会自动覆盖。使用泛型后，data数组中存放的是类对象的引用， size-- 后data[size]依然指向一个引用，引用就涉及到空间释放的问题，Java有自动垃圾回收机制，但如果 data[size]仍存放引用，就不会被自动垃圾回收。data[size] = null;(不必须，可以被新对象覆盖)

如果不置为null，它会被称为loitering Objects，没有用但垃圾回收机制不回收。 loitering Objects != memory leak 为了程序优化，手动去除更好。

Main中改动

Array<Integer> array = new Array(20);
Array<Integer> array = new Array<>(20);

即使不改，也是可以正常运行的。但是我们最好加上更清楚的看出类型，jdk1.7之后不用再后面再重复一次。

package cn.mtianyan;

public class Student {

    private String name;
    private int score;

    public Student(String studentName, int studentScore){
        name = studentName;
        score = studentScore;
    }

    @Override
    public String toString(){
        return String.format("Student(name: %s, score: %d)", name, score);
    }

    public static void main(String[] args) {

        Array<Student> arr = new Array();
        arr.addLast(new Student("mtianyan1", 100));
        arr.addLast(new Student("mtianyan2", 66));
        arr.addLast(new Student("mtianyan3", 88));
        System.out.println(arr);
    }
}

运行结果:

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (!(o instanceof Student)) return false;
        Student student = (Student) o;
        return score == student.score &&
                (name.equals(student.name));
    }

    @Override
    public int hashCode() {
        return Objects.hash(name,score);
    }

重写hashCode和equals方法。

        System.out.println("================start=======================");
        System.out.println(arr);
        arr.remove(1);
        Student stu1 = new Student("mtianyan1", 100);
        Student stu3 = new Student("mtianyan3", 88);
        arr.removeElement(stu1);
        System.out.println(arr);
        System.out.println("==============================================");
        System.out.println(arr);
        arr.removeAllElement(stu3);
        System.out.println(arr);

运行结果:

动态数组

Java静态数组容量有限，固定。我们要将其改造成一个可伸缩的。

不够用了，就开辟一个新的数组，容量是原来的二倍(4变为8)，然后把原来数组的内容进行复制过来(size不变)，最后将data指向新的数组。这里要遍历的把每个值都搞过去，对于性能消耗大不大呢，本章后两节会讨论。

        if (isFull())
            throw new IllegalArgumentException("AddLast failed. Array is Full");
        // 大于size就不是紧密排列了
        if (index<0 || index>size){
            throw new IllegalArgumentException("AddLast failed. Required index<0 or index>size ");
        }

坐标非法依然抛出异常，但是如果满了，我们的动态数组将不会抛出异常。

        if (isFull())
            resize(2*data.length);

这里的2倍，是优于扩大固定大小值的。2的选择是我们自己决定的，Collection中ArrayList中选取了1.5。

    private void resize(int newCapacity) {
        E[] newData = (E[]) new Object[newCapacity];
        for (int i = 0; i < size; i++) {
            newData[i] = data[i];
        }
        data = newData;
    }

package cn.mtianyan;

public class ArrayTestDynamic {
    public static void main(String[] args) {
        Array<Integer> array = new Array<>();
        for (int i = 0; i < 10; i++) {
            array.addLast(i);
        }
        System.out.println(array);
        array.addFirst(99);
        System.out.println(array);
        array.addLast(100);
        System.out.println(array);
    }
}

运行结果:

删除时压缩数组容量

    public E remove(int index){
        // 判空，空数组 removeFirst index=0,size=0，index>=size异常。空数组 removeLast index=-1 index<0异常;
        if (index<0 || index>=size){
            throw new IllegalArgumentException("Remove failed. Required index<0 or index>=size ");
        }else {
            E ret = data[index];
            for (int i=index+1;i < size;i++){
                // 从哪个元素开始挪，从index位置的后一个元素开始，挪到哪个元素结束，挪到size-1(因此没等号)
                data[i-1] = data[i]; // 前一个等于后一个
            }
            size--;
            data[size] = null;

            if (size == data.length /2 )
                resize(data.length /2);
            return ret;
        }
    }

这里设置一个阈值，当数组一半为空时，容量减半。

package cn.mtianyan;

public class ArrayTestDynamic {
    public static void main(String[] args) {
        Array<Integer> array = new Array<>();
        for (int i = 0; i < 10; i++) {
            array.addLast(i);
        }
        System.out.println(array);
        array.addFirst(99);
        System.out.println(array);
        array.addLast(99);
        System.out.println(array);
        array.removeAllElement(99);
        System.out.println(array);
        for (int i = 0; i < 5; i++) {
            array.removeElement(i);
        }
        System.out.println(array);
    }
}

运行结果:

简单的复杂度分析

简单的时间复杂度分析感性认识考研: 细致推导

O(1), O(n) , O(lgn) , O(nlogn) , O(n^2);

大O描述的是算法的运行时间和输入数据之间的关系

public static int sum(int[] nums){
    int sum = 0;
    for(int num: nums) sum += num;
    return sum;
}

通常我们说上面这个代码的算法，时间复杂度是O(n)的。n是nums中的元素个数;算法和n呈线性关系,线性关系表现在一次方。

num 数字越多，算法执行时间越长。

为什么要用大O，叫做O(n)?

因为我们忽略了常数，实际时间 T=c1*n + c2，大O是一个大概的; 对于每一个数所花的时间是c1，int return sum时间是c2。

因此，无论c1，c2是多少，只要符合线性关系都是O(n)的算法。

即使c1，c2很小，但是是二次方，因此是O(n^{2)，性能差于O(n)。没错，理论性能差，但是对于一些小数据，如n=10，反倒是O(n}2)的要执行更快。

渐进时间复杂度，描述n趋近于无穷的情况。（3000）高阶算法常数低反而快于低阶算法: 高级排序算法，归并排序，快速排序，都可以对于小数据转为插入排序，获得10-15%优化，插入排序高阶但常数小。

因为是趋向于无穷的情况，因此可以将其中的低阶项忽略掉。

分析动态数组的时间复杂度

添加操作

addLast(e) // O(1) 末尾添加，直接赋值，其他什么也不做。

O(1)意味着它与我们的数组规模没有关系,不管数组n有多大，addLast都能在常数时间内完成，此时不考虑size变化。

addFirst(e) // O(n) 前面添加，所有元素后挪

n个元素，就要后挪n-1次。

add(index, e)

与index有关。因此可以这样分析：index这么多取值的概率是相等的，严格计算需要一些概率论知识，求出时间期望；平均来看是O(n/2)

添加操作综合来看，整体是O(n)级别的。

在算法复杂度分析上通常关注的是最坏的情况,有一些特例，下小节讲个特例。

resize // O(n)级别

删除操作:

修改操作:

set(index, e) // O(1)级别

查找操作:

get(index) // O(1)
contains(e) // O(n)
find(e)  // O(n)

数组最好情况是已知索引。

如果只对最后一个元素操作，addLast RemoveLast O(1)依然是O(n),因为resize把全部元素重新遍历赋值一遍。看起来resize好像是一个性能很差的操作。

对于resize的分析，使用最差情况是不合理的。下一小节使用均摊复杂度进行分析。

均摊复杂度和防止复杂度的震荡

添加操作

最坏情况下，尾部添加就扩容，从O(1)变成了O(n)级别;但是我们不可能每次操作都resize，10次才会触发一次resize。

假设当前capacity=8,并且每一次添加操作都使用addLast：

9次addLast操作，触发resize,总共进行了17次基本操作。大约平均每次addLast操作，进行2次基本操作。

推广开: 假设capacity = n, 第n+1次addLast,触发resize，总共进行2n+1次基本操作，平均每次addLast操作，进行2次基本操作。

这就将resize的时间平均给了每一次addLast操作,这样均摊下来，时间复杂度是O(1)级别的！和n没有关系。

在这个例子里，这样均摊计算，比计算最坏情况有意义。均摊复杂度 amortized time complexity

同理，我们看removeL ast操作，均摊复杂度也为0(1)

复杂度震荡。

我们单独看removeLast和addLast,它的复杂度为O(1)

但当两个在capacity临界点，一次add 一次remove，会不停的触发resize。存在该情况，出现问题的原因: removeLast时resize过于着急
(Eager)

解决方案: Lazy

当数组size是当前容量的1/4，进行缩容量，缩1/2,则还有1/4空间可以加元素。size == capacity/4时，才将capacity减半。

Lazy方式，懒一下，算法性能更好。后面讲到线段树时还有例子:当更懒，改善算法性能(懒机制代码更多)。

            if (size == data.length /4 && data.length/2 !=0)
                resize(data.length /2);

因为是整数除法，所以当length为1时，会造成等于0，而我们无法new一个容量为0的数组。

设计数据结构，存取数据。下集预告，栈与队列。

2-玩转数据结构-不要小瞧数组
我们要学习的第一个数据结构就是数组，数组中很多值得挖掘。数组基础把数据码成一排进行存放数组中索引从0开始，J...
数据结构之数组
数据结构之数组这个系列是在学习慕课网玩转数据结构课程的学习笔记，用JAVA语言来重新系统的整理一下数据结构的知识...
诗（125）不要小瞧
不要小瞧，这败落的残荷，它也曾有迷人的花朵。不要小瞧，这低矮的山峰，它也曾有壮美的喷薄。不要小瞧，只微弱的阳...
数据结构1-数组_不要小瞧数组_冒泡、选择、插入、归并、快速、随
努力努力再努力xLg 前言数组在Java中算是耳熟能详的了。但是在数据结构方面，它是一个非常基础，并且非常有意义的...
数据结构：数组
00数据结构与算法分析：大纲01数据结构：数组02数据结构：链表03数据结构：栈03数据结构：队列数组数组是一...
第二章不要小瞧数组
遍历数组···· ···· 数组最大的优点：快速查询。数组最好应用于“索引有语意”的情况但并非所有有语意的索引...
不要小瞧
男人总是一厢情愿的把女人想象成可爱的、清纯的、没有自我主见的、和容易被控制的。但实际上这只是男人一厢情愿的想法。...
数据结构和算法-2-数组
上一周只写了个数据结构和算法的开篇，主要是工作比较忙，app要发新版本，又对现有项目的客服sdk进行了升级和封装，...
数据结构和算法-2-数组
数组可以说是我们平时应用最广泛的数据存储结构了，而且使用非常简单，非常适合作为介绍数据结构的起步点。普通数组相...
【第一周】3.将两个按值有序的非空数组合并为一个按值有序的数组
【问题描述】两个非递减组的并集，例如将数组1->2->2->3 和 2->3->5 并为 1->2->3->5。...