C++标准库不提供通用序列化机制;reinterpret_cast(&obj)+write()仅对POD类型安全,含指针、虚函数或STL容器时会因堆内存未保存而崩溃;应手动实现serialize/deserialize或选用protobuf/msgpack等成熟库,并始终加入版本号管理。

直接说结论:C++ 标准库不提供通用对象序列化机制,operator 和 fstream::write() 都不能安全地“一键保存任意对象”——尤其当对象含指针、虚函数、STL 容器或继承关系时。
为什么 reinterpret_cast(&obj) + write() 会出问题
这种写法只对 POD(Plain Old Data)类型有效,比如纯结构体且不含指针、引用、虚函数、非静态成员函数、std::string 等。一旦对象含 std::vector 或 std::string,实际数据在堆上,write() 只存了栈上的指针值,读取时解引用必然崩溃或读到垃圾数据。
- 常见错误现象:
read()后std::string::c_str()段错误、vector.size()返回极大随机数、反序列化后内容全乱 - 虚表指针(vptr)是编译器插入的,跨平台/跨编译器/跨版本不可移植
- 内存对齐和字节序(如 x86 小端 vs ARM 大端)会导致读写不一致
最简可行方案:手动定义 serialize() 和 deserialize() 成员函数
适用于自定义类且结构稳定(如游戏存档、配置缓存),控制力强、无第三方依赖。
- 把每个字段按确定顺序、确定大小逐个读写,绕过指针和容器内部布局
- 对
std::string:先写长度(uint32_t),再写字符数据;读时先读长度,再resize()后read() - 对
std::vector:同理,先写size(),再循环写每个T(前提是T本身可序列化) - 避免直接操作
this地址——用普通函数参数传递,更易测试和复用
struct Player {
int level = 1;
std::string name;
std::vector inventory;
void serialize(std::ostream& os) const {
os.write(reinterpret_cast(&level), sizeof(level));
uint32_t len = static_cast(name.length());
os.write(reinterpret_cast(&len), sizeof(len));
os.write(name.data(), len);
len = static_cast(inventory.size());
os.write(reinterpret_cast(&len), sizeof(len));
for (int item : inventory) {
os.write(reinterpret_cast(&item), sizeof(item));
}
}
void deserialize(std::istream& is) {
is.read(reinterpret_cast(&level), sizeof(level));
uint32_t len;
is.read(reinterpret_cast(&len), sizeof(len));
name.resize(len);
is.read(&name[0], len);
is.read(reinterpret_cast(&len), sizeof(len));
inventory.resize(len);
for (int& item : inventory) {
is.read(reinterpret_cast(&item), sizeof(item));
}
}
};
什么时候该换方案:别硬扛,用成熟库
当出现以下任一情况,手动序列化成本陡增,建议切换:
立即学习“C++免费学习笔记(深入)”;
- 类有继承体系(需处理基类字段、虚继承)
- 需要跨语言交互(如和 Python/JS 通信)
- 要求向后兼容(新增字段不影响旧版本读取)
- 频繁修改结构,手动同步读写逻辑易出错
此时推荐:protobuf(需 .proto 描述)、msgpack(C++ 接口简洁)、或 Boost.Serialization(支持运行时类型信息,但二进制格式不跨平台)。它们都强制你声明“哪些字段参与序列化”,并自动处理容器、指针(含智能指针)、继承等边界情况。
最常被忽略的一点:二进制序列化不是“存完就完”,必须配套版本号管理——哪怕只是文件头加一个 uint32_t version = 1;。没有它,第一次改结构就等于废掉所有旧存档。









