java序列化和反序列化

java领域的对象如何传输

基于socket进行对象传输

如果传输的对象没有序列化会报错:

那么如何解决这个问题呢?

实现一个Serializable接口,再次运行就可以看到对象可以正常传输了

public class User implements Serializeable{
  
}

序列化的意义

​ 当我们对User这个类增加一个Serializable,就可以解决java对象的网络传输问题。这就是序列化的意义。

​ java平台允许我们在内存中创建可复用的java对象,但一般情况下,只有当JVM处于运行时,这些对象才可能存在,即这些对象的生命周期不会比JVM的生命周

期更长。但在现实应用中,就可能要求在JVM停止运行之后能够保存(持久化)指定的对象,并在将来重新读取被保存的对象。java对象序列化就能够帮助我们实

现该功能。

简单来说

​ 序列化是把对象的状态信息转化为可存储或传输的形式过程,也就是把对象转化为字节序列的过程称为对象的序列化。

​ 反序列化是序列化的逆向过程,把字节数组反序列化为对象,把字节序列恢复为对象的过程成为对象的反序列化。

序列化的进阶

java原生序列化

​ 主要通过输出流java.io.ObjectOutputStream和对象输入流java.io.ObjectInputStream来实现。

​ java.io.ObjectOutputStream:表示对象输出流,它的writeObject(Object obj)方法可以对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出

流中。

​ java.io.ObjectInputStream:表示对象输入流,它的readObject()方法源输入流中读取字节序列,在把他们反序列化成为一个对象,并将其返回。

​ 需要注意的是,被序列化对象需要实现java.io.Serializeable接口

serialVersionUID的作用

​ 设置serialVersionUID,字面的意思是序列化的版本号,凡是实现Serializable接口的类都有一个表示序列化版本标识符的静态变量。

证明操作:

​ 1.先将user对象序列化到文件中

​ 2.然后修改user对象,增加serialVersionUID字段

​ 3.然后通过反序列化来把对象提取出来

​ 4.结果:无法反序列化

结论

  java的序列化机制是通过判断类的serialVersion来验证版本一致性的。在进行反序列化时,JVM会把传来的字节流中的serialVersionUID于本地相应实体类的

serialVersionUID进行比较,如果相同就认为是一致的,可以进行反序列化,否则就会出现序列化不一致的异常,即是InvalidCastExecption。

  从结果可以看出,文件流中的class和classpath中的class,也就是修改过后的class,不兼容了,处于安全机制考虑,程序抛出了错误,并且拒绝载入。从错误结

果来看,如果没有为指定的class配置serialVersionUID,那么java编译器会自动给这个class进行一个摘要算法,类似于指纹算法,只要这个文件有任何改动,得到

的UID就会截然不同的,可以保证在这么类中,这个编号是唯一的。所以,由于没有现实指定serialVersionUID,编译器有为我们生成了一个UID,当然和前面保存在

文件中的那个不会一样,于是就出现了2个序列号不一致的错位,因此,只要我们自己指定可serialVersionUID,就可以在序列化后,去添加一个字段,或者方法,

而不会影响到后期的还原,还原后的对象照样可以使用,而且还多个方法或者属性可以用。

tips:serialVersionUID有两种显示的生成方式:

一是默认的1L,比如:private static final long serialVersionUID = 1L;

二是根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段

当实现java.io.Serializable接口的类没有显式的定义一个serialVersionUID变量时候,java序列化机制会根据编译的Class自动生成一个serialVersionUID作序列化版本比较,这种情况下,
如果Class文件(类名,方法名等)没有发生变化(增加空格,换行,增加注释等等),就算再编译多次,serialVersionUID也不会变化的。

Transient关键字

Transient关键字的作用是控制变量的序列化,在变量声明前加上该关键字,可以阻止该变量被序列化到文件中,在被反序列化后,transient变量的值被设为初始

值,如int型的是0,对象型的是null。

绕开transient机制的方法

private transient String name;

如上虽然name被transient修饰,但是通过我们写的两个方法依然能够使得name字段正确被序列化和反序列化

writeObject和readObject原理

writeObject和readObject是两个私有的方法,他们是什么时候被调用呢?从运行结果来看,他确实被调用了。而且他们并不存在于java.lang.Object,也没有在Serializable中去声明。

从源码层面上来分析可以看到,readObject是通过反射来调用的。

其实我们可以在很多的地方看到readObject和writeObject的使用,比如HashMap。

为什么有的代码属性使用了transient修饰符 还要使用writeObject和readObject? 或者说为什么要自己实现writeObject和readObject方法,而不是使用JDK统一的默认序列化和反序列化操作呢?

  这里以HashMap为例:首先要明确序列化的目的,将java对象序列化,一定是为了在某个时刻能够将该对象反序列化,而且一般来讲序列化和反序列化所在的机器是不同的,

因为序列化最常用的场景就是跨机器的调用,而序列化和反序列化的一个最基本的要求就是,反序列化之后的对象与序列化之前的对象是一致的。

  HashMap中,由于Entry的存放位置是根据Key的Hash值来计算,然后存放到数组中的,对于同一个Key,在不同的JVM实现中计算得出的Hash值可能是不同的。
  
  Hash值不同导致的结果就是:有可能一个HashMap对象的反序列化结果与序列化之前的结果不一致。即有可能序列化之前,Key=’AAA’的元素放在数组的第0个位置,而反序列
  
化值后,根据Key获取元素的时候,可能需要从数组为2的位置来获取,而此时获取到的数据与序列化之前肯定是不同的。

解决方式:

将可能会造成数据不一致的元素使用transient关键字修饰,从而避免JDK中默认序列化方法对该对象的序列化操作。不序列化的包括:Entry[] table,size,modCount。

自己实现writeObject方法,从而保证序列化和反序列化结果的一致性。

QA:那么,HashMap又是通过什么手段来保证序列化和反序列化数据的一致性的呢?

首先,HashMap序列化的时候不会将保存数据的数组序列化,而是将元素个数以及每个元素的Key和Value都进行序列化。

在反序列化的时候,重新计算Key和Value的位置,重新填充一个数组。

QA:想想看,是不是能够解决序列化和反序列化不一致的情况呢?

由于不序列化存放元素的Entry数组,而是反序列化的时候重新生成,这样就避免了反序列化之后根据Key获取到的元素与序列化之前获取到的元素不同。

java序列化的一些简单总结

  • java序列化只是针对对象的状态进行保存,至于对象中的方法,序列化不关心

  • 当一个父类实现了序列化,那么子类会自动实现序列化,不需要显示实现序列化接口

  • 当一个对象的实例变量引用了其他对象,序列化这个对象的时候会自动把引用的对象也进行序列化(实现深度克隆)

  • 当某个字段被申明为transient后,默认的序列化机制会忽略这个字段

  • 被申明为transient的字段,如果需要序列化,可以添加两个私有方法:writeObject和readObject

posted @ 2020-10-28 16:42  snail灬  阅读(398)  评论(0编辑  收藏  举报