序列化(Serialization)

一直对序列化这块比较迷糊，也比较感兴趣。
序列化(Serialization)是将结构化对象转换为字节流数据用来在网络中传输，或者写到持久话存储(persistent storage)。
反序列化(Deserialization)是一个相反的过程，将字节流数据转换为一系列的结构化对象。（这点，一直不是很理解。。。）
序列化主要应用分布式数据处理的两个不同的领域，进程通信（interprocess communication)和持久话存储(persistent storage)
Hadoop中，不同节点进程间的通信通过使用RPCs(remote procedure calls),RPC协议就是通过序列化讲信息转化为二进制流传输到远节点，对方反序列化为原始的信息。
一个RPC序列化模式应该：
- 简洁(Compact),简洁的格式能够更好的使用网络带宽，这是在数据中心中最稀缺的资源。
- 快速(Fast),进程通信是分布式系统的骨干，所以序列化和返序列过程不能带来太大的开销
- 扩展性(Extensible),协议一直在变化满足新的需求，因此它需要在可控的范围内直接的扩展协议，包扩可魂断和服务端。
- 互操作(Interoperable),一些系统客户端是通过不同语言写的，因此我们需要来满足这个

posted @ 2016-03-07 19:20 dalu610 阅读(290) 评论(0) 收藏举报

刷新页面返回顶部

dalu610