毛毛的小窝 — 关注技术交流、让我们一起成长

导航

Google推出Protocol Buffers:争夺网络时代数据格式

北京时间7月8日消息,据国外媒体报道,谷歌本周一发布了该公司内部使用的开放源代码数据描述语言Protocol Buffers。Protocol Buffers与XML相似,但更简单、更小、更快。

谷歌开放源代码项目经理克里斯·迪邦纳(Chris DiBona)在一篇博文中写道,“我们在网络上传输或在磁盘上存储的几乎所有结构化信息都采用了这种语言。我们认为Protocol Buffers可能对其他人也有用,因此我们决定将它发布为开放源代码软件。”

谷歌软件工程师肯顿·瓦尔达(Kenton Varda)在公司的开放源代码博客上发表文章称,谷歌使用数千种不同的数据格式,其中大多数都是结构化数据格式。XML无法胜任对这些海量结构化数据编码的重任,谷歌于是开发了Protocol Buffers。

瓦尔达将Protocol Buffers比作是一种界面描述语言,但没有界面描述语言的复杂性。他说,Protocol Buffers的主要设计目标之一是简洁。对Protocol Buffers进行解析的速度也很快,比XML要快出至少一个量级。

谷歌的文档称,与具有可比性的XML文件相比,Protocol Buffers文件的尺寸要小3-10倍,解析速度要快20-100倍。

谷歌发布的免费文件包括采用Java、Python和C++编程语言编写的Protocol Buffers编译器源代码。

谷歌在一份文档中表示,该公司还计划将许多其它软件项目发布为开放源代码软件。因为这些项目会用到Protocol Buffers,因此谷歌决定首先将它发布为开放源代码软件。


在Web 2.0 时代,XML格式由于AJAX的风行以及RSS的普及而异军突起。不过随着Python和Ruby On Rails的走红,以及各种API的发布,YAML,JSON也逐渐成名。此次,Google推出了Protocol Buffers,是想让广大编程者方便地使用Google网络传输数据的格式。

什么是Protocol Buffers?

这是Protocol Buffers主页上的一段代码:

message Person {
required string name = 1;
required int32 id = 2;
optional string email = 3;

enum PhoneType {
MOBILE = 0;
HOME = 1;
WORK = 2;
} message PhoneNumber {
required string number = 1;
optional PhoneType type = 2 [default = HOME];
}

repeated PhoneNumber phone = 4;
}

而Protocol Buffers的作用,就是将以上格式的数据类型,自动生成Java, Python, and C++的代码,然后以下一系列代码就可以直接调用了:(C++中)

Person person;
person.set_name("John Doe");
person.set_id(1234);
person.set_email("jdoe@example.com");
fstream output("myfile", ios::out | ios::binary);
person.SerializeToOstream(&output); fstream input("myfile", ios::in | ios::binary);
Person person;
person.ParseFromIstream(&input);
cout << "Name: " << person.name() << endl;
cout << "E-mail: " << person.email() << endl;

相信所有C++编程者都为定义set,get之类的函数感到烦人过吧,而Google做的就是帮助你省去这些麻烦,构造更利于网络传输的数据结构。

与XML的比较 优势

  • 更简单
  • 比XML小3到10倍体积
  • 比XML快20到100倍
  • 更不容易引起歧义
  • 自动生成可编程的类代码
    比较:
    cout << "Name: " << person.name() << endl;

    cout << "E-mail: " << person.email() << endl;
    cout << "Name: "
           << person.getElementsByTagName("name")->item(0)->innerText()
           << endl;
    cout << "E-mail: "
           << person.getElementsByTagName("email")->item(0)->innerText()
           << endl; 劣势
  • 没有层次,所以无法和HTML标记语言打交道
  • 如果没有message的定义,根本无法知道message的意思,而XML是自解释型的。
    Protocol Buffer主页    Protocol Buffer下载

  • posted on 2008-07-10 08:23  mjgforever  阅读(517)  评论(0编辑  收藏  举报