2017年7月31日

Hadoop-No.3之序列化存储格式

摘要: 序列化存储指的是将数据结构转化为字节流的过程,一般用于数据存储或者网络传输.与之相反, 反序列化是将字节流转化为数据结果的过程.序列化是分布处理系统(比如Hadoop)的核心,原因在于他能对数据进行转化,形成一种格式.使用了这样的格式之后,数据可以有效的... 阅读全文

posted @ 2017-07-31 19:39 Holyz 阅读(217) 评论(0) 推荐(0) 编辑
Hadoop-No.2之标准文件格式

摘要: 标准文件格式可以指文本格式,也可以指二进制文件类型.前者包括逗号分隔值(Comma-Separated Value,CSV和可扩展的标记语言文本(Extensible Markup Language. XML)格式 , 后者包括图像. Hadoop... 阅读全文

posted @ 2017-07-31 14:45 Holyz 阅读(212) 评论(0) 推荐(0) 编辑