- 一直对序列化这块比较迷糊,也比较感兴趣。
- 序列化(Serialization)是将结构化对象转换为字节流数据用来在网络中传输,或者写到持久话存储(persistent storage)。
- 反序列化(Deserialization)是一个相反的过程,将字节流数据转换为一系列的结构化对象。(这点,一直不是很理解。。。)
- 序列化主要应用分布式数据处理的两个不同的领域,进程通信(interprocess communication)和持久话存储(persistent storage)
- Hadoop中,不同节点进程间的通信通过使用RPCs(remote procedure calls),RPC协议就是通过序列化讲信息转化为二进制流传输到远节点,对方反序列化为原始的信息。
- 一个RPC序列化模式应该:
- 简洁(Compact),简洁的格式能够更好的使用网络带宽,这是在数据中心中最稀缺的资源。
- 快速(Fast),进程通信是分布式系统的骨干,所以序列化和返序列过程不能带来太大的开销
- 扩展性(Extensible),协议一直在变化满足新的需求,因此它需要在可控的范围内直接的扩展协议,包扩可魂断和服务端。
- 互操作(Interoperable),一些系统客户端是通过不同语言写的,因此我们需要来满足这个
posted @
2016-03-07 19:20
dalu610
阅读(
290)
评论()
收藏
举报