美文网首页
Java 串行化

Java 串行化

作者: wangdy12 | 来源:发表于2017-10-30 16:56 被阅读0次

Serialization 是把对象的状态转换为字节流,同时字节流也可以转换为对象,反向过程叫做 Deserialization

串行化可以把对象的状态保存到文件中,也可以通过网络传输对象

串行化接口

java.io.Serializable接口是一个标记接口(不含有数据和方法),String和所有的原始数据类型的包装器类都默认实现了该接口

ObjectOutputStream类用来串行化对象为OutputStream,类字段如果是引用,对应的引用对象也需要序列化
ObjectInputStream 类用来反序列化先前串行化的原始数据和对象,重构对象

可以写入多个对象或原始数据类型到输出流,这些对象必须从相应的ObjectInputstream读取,类型和顺序应该要和写入的相同

FileOutputStream fos = new FileOutputStream("t.tmp");
ObjectOutputStream oos = new ObjectOutputStream(fos);

oos.writeInt(12345);
oos.writeObject("Today");
oos.writeObject(new Date());

oos.close();
FileInputStream fis = new FileInputStream("t.tmp");
ObjectInputStream ois = new ObjectInputStream(fis);

int i = ois.readInt();
String today = (String) ois.readObject();
Date date = (Date) ois.readObject();

ois.close();
  • 可以使用try/catch,处理转换过程中可能出现的异常
  • 使用transient修饰符的字段,不会被序列化
  • 静态字段不会序列化(serialVersionUID例外)
  • 不是每个类都可序列化,有些类是不能序列化的, 例如涉及线程的类
  • 子类实现Serializable接口而父类未实现时,父类不会被序列化
  • 父类实现序列化,子类自动实现序列化

如果需要特殊处理序列化和反序列化,可以在类中自定义序列化方法

 private void writeObject(java.io.ObjectOutputStream out)
     throws IOException
 private void readObject(java.io.ObjectInputStream in)
     throws IOException, ClassNotFoundException;
 private void readObjectNoData()
     throws ObjectStreamException;

为了避免因为,JAVA的序列化机制采用了一种特殊的算法:

1、所有保存到磁盘中的对象都有一个序列化编号
2、当程序试图序列化一个对象时,会先检查该对象是否已经被序列化过,只有该对象从未(在本次虚拟机中)被序列化,系统才会将该对象转换成字节序列并输出
3、如果对象已经被序列化,程序将直接输出一个序列化编号,而不是重新序列化

serialVersionUID

用来确保在反序列化的过程中,加载的是同样的类(序列号对应的类)

语法:

ANY-ACCESS-MODIFIER static final long serialVersionUID = 1L;

原因:
有可能序列化一个对象到文件中,几个月后才在不同的JVM进行反序列化,此时对应的类可能已经改变了。
如果要反序列化的serialVersionUID不相同,产生异常InvalidClassException

生成方式:

  • 显式声明,比如和系统的版本保持一致
  • 自动生成,没有显式声明的时候,进行序列化的时候根据相关规则产生一个默认的serialVersionUID,但是相应的计算对类的细节非常敏感,可能编译器的实现而有所不同,所以强烈建议所有可序列化的类都明确声明serialVersionUID

Externalizable

Serializable接口的子类,通过特定的两个方法来指定要序列化的对象,而父类直接序列化所有对象

writeExternal(ObjectOutput out)
readExternal(ObjectInput in)

与父类Serializable的区别,反序列化重构对象时,先通过一个public的无参数构造函数创建对象,再调用readExternal方法,父类是直接通过ObjectInputStream创建的


测试

import java.io.*;

public class Solution {
    public static void main(String[] args) throws IOException {
        ObjectOutputStream outputStream = new ObjectOutputStream(new FileOutputStream("/home/wdy/Desktop/test"));
        outputStream.writeObject(new Test(0xBBBBBBBB,"Wang"));
        outputStream.close();
    }

    public static class Test implements Serializable {
        public static final long serialVersionUID = 0xAAAAAAAAAAAAAAAAL;
        int num;
        String name;

        public Test(int num, String name) {
            this.num = num;
            this.name = name;
        }
    }
}

写出的二进制数据:

  Offset: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F   
00000000: AC ED 00 05 73 72 00 21 63 6F 6D 2E 67 69 74 68    ,m..sr.!com.gith
00000010: 75 62 2E 77 61 6E 67 64 79 31 32 2E 53 6F 6C 75    ub.wangdy12.Solu
00000020: 74 69 6F 6E 24 54 65 73 74 AA AA AA AA AA AA AA    tion$Test*******
00000030: AA 02 00 02 49 00 03 6E 75 6D 4C 00 04 6E 61 6D    *...I..numL..nam
00000040: 65 74 00 12 4C 6A 61 76 61 2F 6C 61 6E 67 2F 53    et..Ljava/lang/S
00000050: 74 72 69 6E 67 3B 78 70 BB BB BB BB 74 00 04 57    tring;xp;;;;t..W
00000060: 61 6E 67                                           ang


解释:

序列化会记录每个类的名称,字段的名称和类型,最后才是具体的数据类型

ObjectOutputStream初始化时就会写出头信息:

  • 写出AC ED表示魔数,即文件类型,写出版本号00 05,这两个字段都是固定的

写一个普通的对象writeOrdinaryObject

  • 对象标志0x73

类描述信息writeClassDesc

  • 类标志0x72,表示一个新的类描述
  • 类名称(modified-utf-8格式,这里编码长度为33字节即0x21,大字节序写出为short形式,之后是UTF内容,这里全部是单字节编码com.github.wangdy12.Solution$Test),序列号(8个0xAA
  • 标志,一个字节,表示不同的序列化类型(例如对象是否自定义了writeObject方法),这里为0x02
  • 字段数目,两个字节,这里为00 02,即两个字段,接下来处理每个字段的描述信息
  • int字段的写出,类型占用一个字节,对应为I,即49,接下来是字段名称,前两个字节表示长度00 03,后面是具体的名称num
  • String字段的写出:签名第一个字符对应为L,即0x4C,然后是字段名称,前两个字节表示长度00 04,后面是字段名称name,如果不是原始类型,再写出其类型签名,这里是Ljava/lang/String;,以writeString写出其类型签名,先写标志0x74,然后内部再调用writeUTF以UTF形式写出,长度0x12,即18,内容Ljava/lang/String;
  • 对象块的结束标志0x78
  • 递归写出对象的父类信息描述,递归调用writeClassDesc,这里为null,写出0x70

写出具体的数据writeSerialData

  • 如果有自定义的writeObject就调用,如果没有使用默认的defaultWriteFields写出,先写出原始数据类型的值,然后写出对象字段中的实际数据

序列化使用的常量位于ObjectStreamConstants类中,内部包含一些标志位

static final short STREAM_MAGIC = (short)0xaced;
static final short STREAM_VERSION = 5;
static final byte TC_NULL =         (byte)0x70;
static final byte TC_CLASSDESC =    (byte)0x72;
static final byte TC_OBJECT =       (byte)0x73;
static final byte TC_STRING =       (byte)0x74;
static final byte TC_ENDBLOCKDATA = (byte)0x78;

Kryo

一种更高效的的序列化方式,相同对象的序列化,大小大大减小

public class Solution {
    public static void main(String[] args) throws IOException {
        Kryo kryo = new Kryo();
        kryo.register(Test.class);//需要进行注册,不注册时改为 kryo.setRegistrationRequired(false);
        Test test = new Test(0xBBBBBBBB,"Wang");
        Output output = new Output(new FileOutputStream("/home/wdy/Desktop/test-kryo"));
        kryo.writeClassAndObject(output, test);
        output.close();

        Input input = new Input(new FileInputStream("/home/wdy/Desktop/test-kryo"));
        Object object2 = kryo.readClassAndObject(input);
        input.close();
        System.out.println(((Test)object2).num);
    }
}

注册后序列化结果只有10个字节,不包含类型信息,第一个字节是一个变长int,表示注册对应的序号,之后四个字节表示Wang,且g最后一个字节的最高位为1,即最后一个字节为负数,表示字符串结束,最后五个字节是一个边长编码的int,即0xBBBBBBBB

  Offset: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F   
00000000: 0B 57 61 6E E7 89 91 A2 C4 08                      .Wang.."D.

如果不进行注册,对应结果会记录类名称

  Offset: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F   
00000000: 01 00 63 6F 6D 2E 67 69 74 68 75 62 2E 77 61 6E    ..com.github.wan
00000010: 67 64 79 31 32 2E 53 6F 6C 75 74 69 6F 6E 24 54    gdy12.Solution$T
00000020: 65 73 F4 57 61 6E E7 89 91 A2 C4 08                estWang.."D.

相关文章

  • Java 串行化

    Serialization 是把对象的状态转换为字节流,同时字节流也可以转换为对象,反向过程叫做 Deserial...

  • java关键字Transient

    Java关键字Transient //表示一个域不是该对象串行化(serilaization)的一部分。 tran...

  • 面试题之IO&并发编程

    什么是IO?Java中IO是以流为基础进行数据的输入输出的,所有数据被串行化写入输出流。简单来说就是java通过i...

  • PHP笔记之对象串行化

    串行化:序列化,将对象转成字符串应用场合:1.将对象在网络中传输2.将对象持久保存 将一个对象串行化 将串行化后的...

  • 9月28日四期C++总结

    今天老师带我们学习了CArchive类、类对象的串行化、文件对话框和CObArray对象数组。 类对象的串行化就是...

  • 多版本并发控制: MVCC

    为什么需要MVCC 实现隔离性最简单的方式是串行化,而实现串行化最简单的办法就是加锁,但是很多应用的一个特点都是读...

  • 谈谈人脑和电脑

    在产生理性之前,还有一个重要的因素,就是“串行化”。串行化对于人类的思维非常重要,是人类的思维从感知到理性的必经的...

  • 《Designing Data-Intensive Applic

    1.说明 前面讲了几个隔离级别,有这样的问题 这一节就讲解串行化,顾名思义,就是结果和串行化执行一样。往往通过下面...

  • [转]FaunaDB的分布式事务协议

    FaunaDB是一个分布式数据库平台支持串行化,外部一致性(也称之为严格的可串行化)事务。跟Spanner或者类似...

  • 1.4 SERIALIZABLE(串行化)

    1.设置为串行化 SET GLOBAL TRANSACTION ISOLATION LEVEL REPEATABL...

网友评论

      本文标题:Java 串行化

      本文链接:https://www.haomeiwen.com/subject/baskpxtx.html