FlatBuffers和Cap'n Proto是高性能二进制序列化库,支持零拷贝访问;FlatBuffers通过schema定义数据结构,使用flatc生成代码,实现高效序列化与直接访问,适用于C++等多语言环境。

在C++中进行高效的数据持久化或网络传输时,二进制序列化是关键环节。相比JSON等文本格式,二进制序列化更紧凑、读写更快。FlatBuffers 和 Cap'n Proto 是两种现代、高性能的二进制序列化库,专为零拷贝访问设计,广泛用于游戏、嵌入式系统和高性能服务。
FlatBuffers 简介与使用
FlatBuffers 是 Google 开发的一种序列化库,特点是在不解析或反序列化的前提下直接访问数据。它将数据以扁平的二进制格式存储在一块连续内存中,通过偏移量和元数据快速定位字段。
优点:- 无需反序列化即可访问数据,性能极高
- 内存占用小,适合资源受限环境
- 支持多种语言,包括 C++、Java、Python 等
- 生成代码安全,类型检查严格
- 定义 schema(.fbs 文件)
- 使用 flatc 工具生成 C++ 代码
- 构建和访问二进制 buffer
示例 schema:
table Person {
name:string;
age:int;
}
root_type Person;
序列化:
立即学习“C++免费学习笔记(深入)”;
flatbuffers::FlatBufferBuilder builder;
auto name = builder.CreateString("Alice");
PersonBuilder pb(builder);
pb.add_name(name);
pb.add_age(30);
auto person = pb.Finish();
builder.Finish(person);
反序列化(实际是直接访问):
auto p = GetPerson(buffer_pointer); std::cout << p->name()->str() << ", " << p->age() << std::endl;
Cap'n Proto 简介与使用
Cap'n Proto 是由 Kenton Varda 开发的另一种零拷贝序列化格式,设计上比 FlatBuffers 更进一步:其数据结构本身就是可直接读写的内存映像,甚至支持在序列化后修改字段。
优点:- 真正的零反序列化:数据加载即可用
- 支持读写模式,可在已序列化的 buffer 上修改数据
- 支持默认值压缩,减少空间占用
- 语法类似 Protocol Buffers,学习成本低
- 编写 .capnp schema
- 使用 capnp 工具生成头文件
- 使用 Builder 构建对象,或从字节数组读取
示例 schema:
struct Person {
name @0 :Text;
age @1 :Int32;
}
序列化:
立即学习“C++免费学习笔记(深入)”;
::capnp::MallocMessageBuilder message; auto person = message.initRoot(); person.setName("Bob"); person.setAge(25); ::capnp::FlatArrayWriter writer; auto output = writeMessageToBytes(message, writer);
反序列化(直接映射):
::capnp::FlatArrayMessageReader reader(input_bytes); auto person = reader.getRoot(); std::cout << person.getName().cStr() << ", " << person.getAge() << std::endl;
FlatBuffers vs Cap'n Proto 对比
两者都强调性能和零拷贝,但在设计理念和使用细节上有差异。
性能:
- Cap'n Proto 在读取性能上略优,因为不需要偏移解引用
- FlatBuffers 编码更紧凑,尤其对短字符串和小整数
灵活性:
- Cap'n Proto 支持可变结构体,允许修改已序列化的数据
- FlatBuffers 构建后不可变,但构建过程更轻量
生态与工具链:
- FlatBuffers 社区更大,文档丰富,Unity 和游戏引擎集成好
- Cap'n Proto 更适合需要高吞吐 RPC 的场景,如 Sandstorm 平台
基本上就这些。选择哪个取决于具体需求:如果追求极致读取速度和可修改性,选 Cap'n Proto;如果注重兼容性、小体积和广泛支持,FlatBuffers 是更稳妥的选择。











