Protocol Buffer 简介
一、Protocol Buffer 与 XML、JSON 的区别
Protocol Buffer 和 XML、JSON一样都是结构数据序列化的工具,但它们的数据格式有比较大的区别:
首先,Protocol Buffer 序列化之后得到的数据不是可读的字符串,而是二进制流
其次,XML 和 JSON 格式的数据信息都包含在了序列化之后的数据中,不需要任何其它信息就能还原序列化之后的数据;但使用 Protocol Buffer 需要事先定义数据的格式(.proto 协议文件),还原一个序列化之后的数据需要使用到这个定义好的数据格式
最后,在传输数据量较大的需求场景下,Protocol Buffer 比 XML、JSON 更小(3到10倍)、更快(20到100倍)、使用 & 维护更简单;而且 Protocol Buffer 可以跨平台、跨语音使用
二、Protocol Buffer 的作用
通过将结构化的数据(拥有多种属性)进行序列化,从而实现(内存与硬盘之间)数据存储和交换的功能
序列化: 按照 .proto 协议文件将数据结构或对象转换成二进制流的过程
反序列化:将在序列化过程中所生成的二进制流转换成数据结构或对象的过程
三、构建 Protocol Buffer 消息对象模型

1、通过 Protocol Buffer 语法描述需要存储的数据结构
Protocol Buffer 定义数据格式的文件一般保存在 .proto文件中,每一个 message代表了一类结构化的数据,message 里面定义了每一个属性的类型和名字。
一个消息对象可以将其他消息对象类型用作字段类型,情况如下:

# 1、包名 package protocobuff_Demo; # 2、option 选项 option java_package = "com.carson.proto"; option java_outer_classname = "Demo"; # 3、消息模型 # 3.1、生成 Person 消息对象(包含多个字段) message Person { required string name = 1; required int32 id = 2; optional string email = 3; enum PhoneType { MOBILE = 0; HOME = 1; WORK = 2; } # 该消息类型定义在 Person 消息类型的内部 # 即 Person 消息类型是 PhoneNumber 消息类型的父消息类型 message PhoneNumber { required string number = 1; optional PhoneType type = 2 [default = HOME]; } # 直接使用内部消息类型 repeated PhoneNumber phone = 4; } # 3.2 使用外部消息类型,直接使用了 Person 消息类型作为消息字段 message AddressBook { repeated Person person = 1; }
2、通过 Protocol Buffer 编译器编译 .proto 文件
作用:将 .proto 文件 转换成对应平台(python、C++、Java)的代码文件
编译指令如下所示:
# 在终端输入下列命令进行编译 protoc -I=$SRC_DIR --xxx_out=$DST_DIR $SRC_DIR/addressbook.proto # 参数说明 # 1. $SRC_DIR:指定需要编译的.proto文件目录 (如没有提供则使用当前目录) # 2. --xxx_out:xxx根据需要生成代码的类型进行设置 """ 对于 Java ,xxx = java ,即 -- java_out 对于 C++ ,xxx = cpp ,即 --cpp_out 对于 Python,xxx = python,即 --python_out """ # 3. $DST_DIR :编译后代码生成的目录 (通常设置与$SRC_DIR相同) # 4. 最后的路径参数:需要编译的.proto 文件的具体路径 # 编译通过后,Protoco Buffer会根据不同平台生成对应的代码文件
四、参考资料
1、这是一份很有诚意的 Protocol Buffer 语法详解
2、手把手教你如何安装 Protocol Buffer
浙公网安备 33010602011771号