java序列化和反序列化

java领域的对象如何传输

基于socket进行对象传输

如果传输的对象没有序列化会报错：

那么如何解决这个问题呢？

实现一个Serializable接口，再次运行就可以看到对象可以正常传输了

public class User implements Serializeable{
  
}

序列化的意义

当我们对User这个类增加一个Serializable，就可以解决java对象的网络传输问题。这就是序列化的意义。

java平台允许我们在内存中创建可复用的java对象，但一般情况下，只有当JVM处于运行时，这些对象才可能存在，即这些对象的生命周期不会比JVM的生命周

期更长。但在现实应用中，就可能要求在JVM停止运行之后能够保存（持久化）指定的对象，并在将来重新读取被保存的对象。java对象序列化就能够帮助我们实

现该功能。

简单来说

序列化是把对象的状态信息转化为可存储或传输的形式过程，也就是把对象转化为字节序列的过程称为对象的序列化。

反序列化是序列化的逆向过程，把字节数组反序列化为对象，把字节序列恢复为对象的过程成为对象的反序列化。

序列化的进阶

java原生序列化

主要通过输出流java.io.ObjectOutputStream和对象输入流java.io.ObjectInputStream来实现。

java.io.ObjectOutputStream:表示对象输出流，它的writeObject(Object obj)方法可以对参数指定的obj对象进行序列化，把得到的字节序列写到一个目标输出

流中。

java.io.ObjectInputStream:表示对象输入流，它的readObject()方法源输入流中读取字节序列，在把他们反序列化成为一个对象，并将其返回。

需要注意的是，被序列化对象需要实现java.io.Serializeable接口

serialVersionUID的作用

设置serialVersionUID，字面的意思是序列化的版本号，凡是实现Serializable接口的类都有一个表示序列化版本标识符的静态变量。

证明操作：

1.先将user对象序列化到文件中

2.然后修改user对象，增加serialVersionUID字段

3.然后通过反序列化来把对象提取出来

4.结果：无法反序列化

结论

  java的序列化机制是通过判断类的serialVersion来验证版本一致性的。在进行反序列化时，JVM会把传来的字节流中的serialVersionUID于本地相应实体类的

serialVersionUID进行比较，如果相同就认为是一致的，可以进行反序列化，否则就会出现序列化不一致的异常，即是InvalidCastExecption。

  从结果可以看出，文件流中的class和classpath中的class，也就是修改过后的class，不兼容了，处于安全机制考虑，程序抛出了错误，并且拒绝载入。从错误结

果来看，如果没有为指定的class配置serialVersionUID,那么java编译器会自动给这个class进行一个摘要算法，类似于指纹算法，只要这个文件有任何改动，得到

的UID就会截然不同的，可以保证在这么类中，这个编号是唯一的。所以，由于没有现实指定serialVersionUID,编译器有为我们生成了一个UID,当然和前面保存在

文件中的那个不会一样，于是就出现了2个序列号不一致的错位，因此，只要我们自己指定可serialVersionUID,就可以在序列化后，去添加一个字段，或者方法，

而不会影响到后期的还原，还原后的对象照样可以使用，而且还多个方法或者属性可以用。

tips：serialVersionUID有两种显示的生成方式：

一是默认的1L,比如：private static final long serialVersionUID = 1L;

二是根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段

当实现java.io.Serializable接口的类没有显式的定义一个serialVersionUID变量时候，java序列化机制会根据编译的Class自动生成一个serialVersionUID作序列化版本比较，这种情况下，
如果Class文件（类名，方法名等）没有发生变化（增加空格，换行，增加注释等等），就算再编译多次，serialVersionUID也不会变化的。

Transient关键字

Transient关键字的作用是控制变量的序列化，在变量声明前加上该关键字，可以阻止该变量被序列化到文件中，在被反序列化后，transient变量的值被设为初始

值，如int型的是0，对象型的是null。

绕开transient机制的方法

private transient String name;

如上虽然name被transient修饰，但是通过我们写的两个方法依然能够使得name字段正确被序列化和反序列化

writeObject和readObject原理

writeObject和readObject是两个私有的方法，他们是什么时候被调用呢？从运行结果来看，他确实被调用了。而且他们并不存在于java.lang.Object，也没有在Serializable中去声明。

从源码层面上来分析可以看到，readObject是通过反射来调用的。

其实我们可以在很多的地方看到readObject和writeObject的使用，比如HashMap。

为什么有的代码属性使用了transient修饰符还要使用writeObject和readObject？或者说为什么要自己实现writeObject和readObject方法，而不是使用JDK统一的默认序列化和反序列化操作呢？

  这里以HashMap为例：首先要明确序列化的目的，将java对象序列化，一定是为了在某个时刻能够将该对象反序列化，而且一般来讲序列化和反序列化所在的机器是不同的，

因为序列化最常用的场景就是跨机器的调用，而序列化和反序列化的一个最基本的要求就是，反序列化之后的对象与序列化之前的对象是一致的。

  HashMap中，由于Entry的存放位置是根据Key的Hash值来计算，然后存放到数组中的，对于同一个Key，在不同的JVM实现中计算得出的Hash值可能是不同的。
  
  Hash值不同导致的结果就是：有可能一个HashMap对象的反序列化结果与序列化之前的结果不一致。即有可能序列化之前，Key=’AAA’的元素放在数组的第0个位置，而反序列
  
化值后，根据Key获取元素的时候，可能需要从数组为2的位置来获取，而此时获取到的数据与序列化之前肯定是不同的。

解决方式：

将可能会造成数据不一致的元素使用transient关键字修饰，从而避免JDK中默认序列化方法对该对象的序列化操作。不序列化的包括：Entry[] table,size,modCount。

自己实现writeObject方法，从而保证序列化和反序列化结果的一致性。

QA:那么，HashMap又是通过什么手段来保证序列化和反序列化数据的一致性的呢？

首先，HashMap序列化的时候不会将保存数据的数组序列化，而是将元素个数以及每个元素的Key和Value都进行序列化。

在反序列化的时候，重新计算Key和Value的位置，重新填充一个数组。

QA:想想看，是不是能够解决序列化和反序列化不一致的情况呢？

由于不序列化存放元素的Entry数组，而是反序列化的时候重新生成，这样就避免了反序列化之后根据Key获取到的元素与序列化之前获取到的元素不同。

java序列化的一些简单总结

java序列化只是针对对象的状态进行保存，至于对象中的方法，序列化不关心
当一个父类实现了序列化，那么子类会自动实现序列化，不需要显示实现序列化接口
当一个对象的实例变量引用了其他对象，序列化这个对象的时候会自动把引用的对象也进行序列化（实现深度克隆）
当某个字段被申明为transient后，默认的序列化机制会忽略这个字段
被申明为transient的字段，如果需要序列化，可以添加两个私有方法：writeObject和readObject

posted @ 2020-10-28 16:42 snail灬阅读(467) 评论(0) 收藏举报

刷新页面返回顶部

snail