Java序列化

作者: 一个理想主义的大兵 | 来源:发表于2018-02-09 15:17 被阅读0次

关于java序列化，一些核心的概念。

基本概念

序列化的定义

序列化是将Java对象转换成字节流文件，反序列化就是反过来。

字节流文件，很多人写成二进制字节流，我感觉并不准确，字节流文件是二进制文件不假（1个字节是8个比特），字节流文件打开后是0和1组成的比特流（当然可以用其他进制，比如十六进制查看），但二进制字节这种说法就很不准确，我看可以说成二进制位流或二级制比特流。

序列化是的作用

对象的存储，jvm虚拟机生命周期结束，所有的对象的生命周期就都结束了（可能更短，比如不再被引用后，被垃圾回收），所以想把对象持久化，可以把对象序列化成字节流存储
用于对象在网络中传输

序列化ID (serialVersionUID)

序列化对象的唯一标识。

序列化流程：比如一个对象Object从A实例传输到B实例，序列化成字节流后通过网络传输，这个对象一定在两个实例上都是存在的（参考真实的使用场景）。从A实例传输过来的字节流包含了类属性字段的数据，在B实例处进行反序列化时，根据B实例本地的类Object信息，填充数据，生成对应的对象。
ID作用：序列化时，会将serialVersionUID，写入字节流文件，在反序列化时，与当地对象的serialVersionUID进行比较，一致才进行序列化，不一致报错。
省略serialVersionUID：jvm会在编译时，动态的根据类的属性信息（具体生成规则，有待进一步研究）生成一个ID，可能会根据jvm版本不同，所以在运行着不同JVM实例之间进行序列化，可能会报错，不推荐使用。建议显示定义serialVersionUID

静态变量并不能序列化

序列化保存的是对象的状态，并不保存类的状态，所以对象中的静态变量并不会被序列化。

父类序列化

情境：一个子类实现了 Serializable 接口，它的父类都没有实现 Serializable 接口，序列化该子类对象，然后反序列化后输出父类定义的某变量的数值，该变量数值与序列化时的数值不同。

解决：要想将父类对象也序列化，就需要让父类也实现****Serializable 接口。如果父类不实现的话的，就 需要有默认的无参的构造函数。在父类没有实现 Serializable 接口时，虚拟机是不会序列化父对象的，而一个 Java 对象的构造必须先有父对象，才有子对象，反序列化也不例外。所以反序列化时，为了构造父对象，只能调用父类的无参构造函数作为默认的父对象。因此当我们取父对象的变量值时，它的值是调用父类无参构造函数后的值。如果你考虑到这种序列化的情况，在父类无参构造函数中对变量进行初始化，否则的话，父类变量值都是默认声明的值，如 int 型的默认是 0，string 型的默认是 null。

引用自—— 《Java 序列化的高级认识》

Transient 关键字

类中可能存在某些敏感的信息,我们是不想在网络中传输的,这时候我们就需要借助 transient 关键字了。被transient关键字标识的 field,不会进行序列化.
下面通过一个例子说明 transient 关键字的作用.现假设我们需要在网络中传输 Person 类:

public class Person implements Serializable{

    private static final long serialVersionUID = 1L;

    private String name;
    private String certNo; // 身份证号码
    private int age;

    public Person(String name, String certNo, int age) {
        this.name = name;
        this.certNo = certNo;
        this.age = age;
    }

    @Override
    public String toString() {
        return "Person{" +
                "name='" + name + '\'' +
                ", certNo='" + certNo + '\'' +
                ", age=" + age +
                '}';
    }
}

若不使用 transient 关键字,反序列化时输出的信息是 :

Person{name='tianya', certNo='12314', age=23}

我们知道,身份证号码属于敏感信息,并不想在网络中传输,这时我们就可以借助 transient 关键字,如下:

    private transient String certNo;

这个时候,通过反序列化获取的 Person 信息如下 :

Person{name='tianya', certNo='null', age=23}

序列化存储规则

Java 序列化机制为了节省磁盘空间，具有特定的存储规则，当写入文件的为同一对象时，并不会再将对象的内容进行存储，而只是再次存储一份引用，下面增加的 5 字节的存储空间就是新增引用和一些控制信息的空间。反序列化时，恢复引用关系。
下面示例中的 test1 和 test2 指向唯一的对象，二者相等，输出 true。该存储规则极大的节省了存储空间。

/**
 * 此示例展示序列化同一个对象的存储规则：同一个对象序列化两次，为了提高存储率，使用相同的引用。
 * 注：即使修改对象属性，依然无效，以第一个对象为准（都是引用第一个对象），值得注意！
 */
public class WriteTwiceObject {
    public static void main(String[] args) throws Exception{
        ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream("test.obj"));
        Test t = new Test();
        t.test = 1;
        objectOutputStream.writeObject(t);
        objectOutputStream.flush();
        System.out.println(new File("test.obj").length());
        t.test = 2;
        objectOutputStream.writeObject(t);
        objectOutputStream.close();
        System.out.println(new File("test.obj").length());

        ObjectInputStream objectInputStream = new ObjectInputStream((new FileInputStream("test.obj")));
        //对象属性的改变并没有生效
        Test test1 = (Test) objectInputStream.readObject();
        System.out.println(test1.test);
        Test test2 = (Test) objectInputStream.readObject();
        System.out.println(test2.test);
        //true 表明两个对象是同一个引用
        System.out.println(test1 == test2);

    }
}
    class Test implements Serializable{
        private final static long serialVersionUID = 1l;

        public int test;
    }

//output: 
56
61
1
1
true

Reference:

《Java 序列化的高级认识》
stackoverflow原址：http://stackoverflow.com/questions/910374/why-does-java-have-transient-variables

网友评论

本文标题：Java序列化

本文链接：https://www.haomeiwen.com/subject/spnftftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！