Protocol Buffer 简介

一、Protocol Buffer 与 XML、JSON 的区别
　　Protocol Buffer 和 XML、JSON一样都是结构数据序列化的工具，但它们的数据格式有比较大的区别：
　　首先，Protocol Buffer 序列化之后得到的数据不是可读的字符串，而是二进制流
　　其次，XML 和 JSON 格式的数据信息都包含在了序列化之后的数据中，不需要任何其它信息就能还原序列化之后的数据；但使用 Protocol Buffer 需要事先定义数据的格式(.proto 协议文件)，还原一个序列化之后的数据需要使用到这个定义好的数据格式
　　最后，在传输数据量较大的需求场景下，Protocol Buffer 比 XML、JSON 更小（3到10倍）、更快（20到100倍）、使用 & 维护更简单；而且 Protocol Buffer 可以跨平台、跨语音使用

二、Protocol Buffer 的作用
　　通过将结构化的数据（拥有多种属性）进行序列化，从而实现（内存与硬盘之间）数据存储和交换的功能
　　序列化：按照 .proto 协议文件将数据结构或对象转换成二进制流的过程
　　反序列化：将在序列化过程中所生成的二进制流转换成数据结构或对象的过程

三、构建 Protocol Buffer 消息对象模型

1、通过 Protocol Buffer 语法描述需要存储的数据结构
　　Protocol Buffer 定义数据格式的文件一般保存在 .proto文件中，每一个 message代表了一类结构化的数据，message 里面定义了每一个属性的类型和名字。
　　一个消息对象可以将其他消息对象类型用作字段类型，情况如下：

# 1、包名
package protocobuff_Demo;

# 2、option 选项
option java_package = "com.carson.proto";
option java_outer_classname = "Demo";


# 3、消息模型
# 3.1、生成 Person 消息对象（包含多个字段）
message Person {
required string name = 1;
required int32 id = 2;
optional string email = 3;

enum PhoneType {
MOBILE = 0;
HOME = 1;
WORK = 2;
}

# 该消息类型定义在 Person 消息类型的内部
# 即 Person 消息类型是 PhoneNumber 消息类型的父消息类型
message PhoneNumber {
required string number = 1;
optional PhoneType type = 2 [default = HOME];
}

# 直接使用内部消息类型
repeated PhoneNumber phone = 4;
}

# 3.2 使用外部消息类型，直接使用了 Person 消息类型作为消息字段
message AddressBook {
repeated Person person = 1;
}

2、通过 Protocol Buffer 编译器编译 .proto 文件
　　作用：将 .proto 文件转换成对应平台（python、C++、Java）的代码文件
　　编译指令如下所示：

# 在终端输入下列命令进行编译
protoc -I=$SRC_DIR --xxx_out=$DST_DIR $SRC_DIR/addressbook.proto

# 参数说明
# 1. $SRC_DIR：指定需要编译的.proto文件目录 (如没有提供则使用当前目录)
# 2. --xxx_out：xxx根据需要生成代码的类型进行设置
"""
对于 Java ，xxx = java ，即 -- java_out
对于 C++ ，xxx = cpp ，即 --cpp_out
对于 Python，xxx = python，即 --python_out
"""

# 3. $DST_DIR ：编译后代码生成的目录 (通常设置与$SRC_DIR相同)
# 4. 最后的路径参数：需要编译的.proto 文件的具体路径

# 编译通过后，Protoco Buffer会根据不同平台生成对应的代码文件

四、参考资料
　　1、这是一份很有诚意的 Protocol Buffer 语法详解
　　2、手把手教你如何安装 Protocol Buffer

posted on 2022-02-17 10:00 爱学习的小灵子阅读(206) 评论(0) 收藏举报