标记-清除算法通过标记阶段从根对象出发标记所有可达对象,清除阶段回收未标记对象;C++中可模拟实现:定义GCObject基类、维护全局对象集与根集,重写markChildren遍历引用,执行mark-sweep流程回收不可达对象,示例中unreachable因无引用被释放,最终对象数减一。

在C++中实现一个简单的垃圾回收器,可以通过手动模拟“标记-清除”(Mark-Sweep)算法来管理动态分配的对象。虽然C++本身不提供自动垃圾回收机制,但我们可以利用智能指针、对象图遍历和内存标记技术来实现基础版本。
什么是标记-清除(Mark-Sweep)算法?
标记-清除算法是最早的垃圾回收策略之一,分为两个阶段:
- 标记阶段:从根对象(如全局变量、栈上指针)出发,遍历所有可达对象,并给它们打上“存活”标记。
- 清除阶段:扫描整个堆内存,回收未被标记的对象,释放其内存,并清除已标记对象的标记位以便下次使用。
该算法适用于存在复杂引用关系的对象系统,比如树形结构或图结构。
C++中如何模拟垃圾回收?
由于C++没有运行时类型信息(RTTI)支持完整的对象图遍历,我们需要对可被回收的对象进行封装,并显式维护引用关系。
立即学习“C++免费学习笔记(深入)”;
以下是一个简化的实现思路:
- 定义一个基类 GCObject,所有可被回收的对象都继承它。
- 用一个全局集合记录所有已分配的 GCObject*。
- 每个对象包含一个标记位(mark bit)。
- 提供根集(root set),例如当前活动的指针列表。
- 实现 mark 阶段:从根开始递归标记所有可达对象。
- 实现 sweep 阶段:遍历所有对象,删除未标记的。
代码示例:简易 Mark-Sweep GC
下面是一个极简版本的实现框架:
#include#include #include #include class GCObject { public: bool marked; GCObject() : marked(false) {} virtual ~GCObject() = default; virtual void markChildren() {} // 子类重写以标记引用的子对象 };
// 全局对象池和根集 std::set
> all_objects; std::vector > roots; void gc_mark() { for (auto* obj : roots) { if (obj && !obj->marked) { obj->marked = true; obj->markChildren(); } } }
void gc_sweep() { auto it = all_objects.begin(); while (it != all_objects.end()) { GCObject obj = it; if (!obj->marked) { it = all_objects.erase(it); delete obj; // 实际回收 } else { obj->marked = false; // 重置标记供下次使用 ++it; } } }
void garbage_collect() { std::cout << "开始垃圾回收...\n"; gc_mark(); gc_sweep(); std::cout << "垃圾回收完成。\n"; }
// 示例:一个持有其他对象引用的类 class ListObject : public GCObject { public: std::vector
elements; void markChildren() override { for (auto* elem : elements) { if (elem && !elem->marked) { elem->marked = true; elem->markChildren(); } } } void add(GCObject* obj) { elements.push_back(obj); }};
// 辅助函数:注册新对象 template
T new_object() { T obj = new T(); all_objects.insert(obj); return obj; } // 添加根指针 void push_root(GCObject* obj) { roots.push_back(obj); }
void pop_root() { if (!roots.empty()) roots.pop_back(); }
使用示例
演示一次简单的垃圾回收过程:
int main() { // 创建一些对象并加入根 ListObject* root_list = new_object(); push_root(root_list); // 添加子对象 GCObject* child1 = new_object(); GCObject* child2 = new_object (); root_list->add(child1); root_list->add(child2); // 再创建一个不可达对象 GCObject* unreachable = new_object (); std::cout << "总对象数: " << all_objects.size() << "\n"; // 执行GC garbage_collect(); std::cout << "GC后剩余对象数: " << all_objects.size() << "\n"; // 清理根 pop_root(); return 0; }
输出大致为:
总对象数: 4 开始垃圾回收... 垃圾回收完成。 GC后剩余对象数: 3其中
unreachable没有被任何根或子对象引用,因此被回收。注意事项与局限性
- 需要手动管理根集:程序员必须确保活跃指针正确添加到根中。
- 无法处理循环引用以外的问题:本方案仍依赖开发者正确实现
markChildren。- 性能开销:每次GC需遍历全部对象,不适合高频调用。
- 缺乏类型安全和自动发现引用:C++没有反射机制,无法自动识别成员中的指针。
若要更进一步,可以结合
std::shared_ptr+std::weak_ptr来避免循环引用,但这属于半自动方式,不是真正意义上的GC。总结
尽管C++不内置垃圾回收,但通过继承统一基类、维护对象池和根集,可以实现一个基本的标记-清除回收器。这种技术适合嵌入式脚本引擎、游戏逻辑系统等需要可控内存管理的场景。关键是理解“可达性”概念,并在合适时机触发回收。
基本上就这些,不复杂但容易忽略细节。









