Java对象的序列化和反序列化（转）

一、序列化和反序列化的概念

把对象转换为字节序列的过程称为对象的序列化。

把字节序列恢复为对象的过程称为对象的反序列化。

对象的序列化主要有两种用途：

1）把对象的字节序列永久地保存到硬盘上，通常存放在一个文件中；

2）在网络上传送对象的字节序列。

二、什么场景会涉及序列化和反序列化的概念

　　在很多应用中，需要对某些对象进行序列化，让它们离开内存空间，入住物理硬盘，以便长期保存。比如最常见的是Web服务器中的Session对象，当有 10万用户并发访问，就有可能出现10万个Session对象，内存可能吃不消，于是Web容器就会把一些session先序列化到硬盘中，等要用了，再把保存在硬盘中的对象还原到内存中。

　　当两个进程在进行远程通信时，彼此可以发送各种类型的数据。无论是何种类型的数据，都会以二进制序列的形式在网络上传送。发送方需要把这个Java对象转换为字节序列，才能在网络上传送；接收方则需要把字节序列再恢复为Java对象。

举个真实的案例：当我们需要使用的对象很复杂或者需要很长时间去构造，这时就会引入使用代理模式(Proxy)。例如：如果构建一个对象很耗费时间和计算机资源，代理模式(Proxy)允许我们控制这种情况，直到我们需要使用实际的对象。一个代理(Proxy)通常包含和将要使用的对象同样的方法，一旦开始使用这个对象，这些方法将通过代理(Proxy)传递给实际的对象。

解读：在微服务化盛行的今天，很多复杂的对象构造起来比较耗时，为了节省开支，某些公司将这部分复杂的对象先圈起来，写成服务起在远端B,并在调用端A端以代理（Proxy）的形式提供对服务的访问，这期间从B到A远程调的过程形成了Java对象序列化和反序列化的相关操作！

为了突出Java序列化和反序列化的强大，我们先来看一下设计模式中经常提到的远程代理（代理模式）；

三、什么是远程代理(Proxy)

远程代理角色

JDK提供了个代理类：import java.lang.reflect.Proxy; 来看一下Proxy的实现

Proxy在JDK中实现了Serializable（序列化）接口，但是代理是怎么实现将服务端的对象运行到客户端上的呢？在这里需要先解释一个个人理解的过程：

第一步：远端JVM（服务端）对“对象”使用序列化后通过网络传输的方式将对象的字节序列发送到本地（客户端），

第二步：本地代理（Proxy）将接收到的字节序列再通过反序列化恢复成”对象”，并使这个"对象"活在本地的JVM中；

从上面两步来看，序列化的过程是在服务端做的；反序列化是在客户端做的；那么有个问题来了，从源码上看，Proxy（本地）实现了反序列化，服务端在哪里实现了序列化呢？带着这个问题，继续查看了服务端所有的代码，发现有的公司直接在实体上Serialize，有的则在类上加@Serializable注解利用切面实现，但终究实现了序列化；

四、JDK类库中的序列化API

java.io.ObjectOutputStream代表对象输出流，它的writeObject(Object obj)方法可对参数指定的obj对象进行序列化，把得到的字节序列写到一个目标输出流中。

java.io.ObjectInputStream代表对象输入流，它的readObject()方法从一个源输入流中读取字节序列，再把它们反序列化为一个对象，并将其返回。

　　只有实现了Serializable和Externalizable接口的类的对象才能被序列化。Externalizable接口继承自 Serializable接口，实现Externalizable接口的类完全由自身来控制序列化的行为，而仅实现Serializable接口的类可以采用默认的序列化方式。

　　对象序列化包括如下步骤：

　　1）创建一个对象输出流，它可以包装一个其他类型的目标输出流，如文件输出流；

　　2）通过对象输出流的writeObject()方法写对象。

　　对象反序列化的步骤如下：

　　1）创建一个对象输入流，它可以包装一个其他类型的源输入流，如文件输入流；

　　2）通过对象输入流的readObject()方法读取对象。

五、对象序列化和反序列范例：

　　1）定义一个Person类，实现Serializable接口

2）序列化和反序列化Person类对象

3）代码运行结果如下：

六、serialVersionUID的作用

serialVersionUID: 字面意思上是序列化的版本号，凡是实现Serializable接口的类都有一个表示序列化版本标识符的静态变量

private static final long serialVersionUID

采用“Add generated serial version ID”方式生成的serialVersionUID会根据类名，接口名，方法和属性等来生成。

序列化版本ID的真实用途：当实体中增加属性后，文件流中的class和classpath中的class，也就是修改过后的class，不兼容了，处于安全机制考虑，程序抛出了错误，并且拒绝载入。那么如果我们真的有需求要在序列化后添加一个字段或者方法呢？应该怎么办？那就是自己去指定serialVersionUID。在例子中，如果没有指定Person类的serialVersionUID的，那么java编译器会自动给这个class进行一个摘要算法，类似于指纹算法，只要这个文件多一个空格，得到的UID就会截然不同的，可以保证在这么多类中，这个编号是唯一的。所以，添加了一个字段后，由于没有显指定serialVersionUID，编译器又为我们生成了一个UID，当然和前面保存在文件中的那个不会一样了，于是就出现了2个序列化版本号不一致的错误。因此，只要我们自己指定了serialVersionUID，就可以在序列化后，去添加一个字段，或者方法，而不会影响到后期的还原，还原后的对象照样可以使用，而且还多了方法或者属性可以用。可以说serialVersionUID是序列化和反序列化之间彼此认识的唯一信物。

七、serialVersionUID的取值

serialVersionUID的取值是Java运行时环境根据类的内部细节自动生成的。如果对类的源代码作了修改，再重新编译，新生成的类文件的serialVersionUID的取值有可能也会发生变化。

类的serialVersionUID的默认值完全依赖于Java编译器的实现，对于同一个类，用不同的Java编译器编译，有可能会导致不同的serialVersionUID，也有可能相同。为了提高serialVersionUID的独立性和确定性，强烈建议在一个可序列化类中显示的定义serialVersionUID，为它赋予明确的值。

显式地定义serialVersionUID有两种用途：

1、在某些场合，希望类的不同版本对序列化兼容，因此需要确保类的不同版本具有相同的serialVersionUID；

2、在某些场合，不希望类的不同版本对序列化兼容，因此需要确保类的不同版本具有不同的serialVersionUID。

作者：烨枫_邱
链接：https://www.jianshu.com/p/89c2a19772e2
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

posted on 2020-08-23 13:40 会说话的丶猫阅读(453) 评论(0) 收藏举报