std::function通过虚函数表实现类型擦除,将invoke、copy、destroy等操作抽象为基类接口,派生类按具体类型实现,配合小对象优化减少堆分配。

std::function 是怎么做到“擦掉”具体类型的?
它不存储原始函数对象,而是把调用逻辑和数据打包进一个统一的基类接口里,运行时通过虚函数跳转。关键不是“丢掉类型”,而是把类型行为抽象成 invoke、copy、destroy 这几个固定操作。
典型结构是:std::function 内部持有一个指向基类(比如 std::function_base 或类似)的指针,所有可调用对象(lambda、函数指针、绑定对象)在构造时被包装进对应的派生类实例,并存入堆内存(或小对象优化缓冲区)。
- 每次赋值或构造
std::function,都会触发一次类型专属的包装:生成一个继承自统一基类的临时派生类,重写虚函数实现该类型的调用/拷贝/析构逻辑 - 调用
operator()时,实际走的是基类虚函数表里的invoke入口,由派生类实现具体转发 - 小对象优化(SOO)会让短 lambda 或简单函数指针直接存在
std::function对象内部,避免堆分配——但虚函数调用机制不变
自己手写一个极简 Type Erasure 包装器要注意什么?
核心是定义清晰的接口基类,且所有操作必须能通过虚函数完成。不能依赖模板参数在运行时还“可见”。
struct callable_base {
virtual ~callable_base() = default;
virtual void invoke(int) = 0;
virtual callable_base* clone() const = 0; // 拷贝必须返回基类指针
};
template
struct callable_model : callablebase {
F f;
callablemodel(F f) : f(std::move(f)) {}
void invoke(int x) override { f_(x); }
callable_base* clone() const override {
return new callablemodel(f );
}
};
- 基类析构函数必须是
virtual,否则delete派生对象会未定义行为 -
clone()返回callable_base*,不是auto或模板类型,否则无法统一管理 - 不能在基类里存模板成员变量;所有类型相关数据都得塞进派生类,基类只留虚函数指针
- 若支持移动语义,还需补充
move_construct接口,否则std::function移动后原对象仍可能被误调用
为什么 std::function 的拷贝开销可能比预期大?
每次拷贝 std::function,默认会触发底层可调用对象的深拷贝(via clone()),哪怕那个对象本身是轻量级的(如捕获空的 lambda)。这不是 bug,是类型擦除的设计代价。
立即学习“C++免费学习笔记(深入)”;
- 函数对象若捕获了大块数据(如
std::vector、std::string),拷贝就会变慢 - 即使启用 SOO,超出缓冲大小仍会堆分配,拷贝即堆内存复制 + 构造新对象
- 某些编译器对空 lambda 的
clone做了优化,但不可依赖;真实项目中应避免频繁拷贝std::function - 若只需传递不可变调用体,优先用
const std::function&或直接传模板参数(template)
std::function 的类型擦除和 void* + 函数指针有什么本质区别?
区别在于安全性和扩展性。void* 方案靠程序员手动维护类型信息和调用约定,而 std::function 把类型契约封装进虚函数表,编译器保证调用安全。
-
void*无法自动处理移动/拷贝/析构,容易内存泄漏或二次析构 - 虚函数方案天然支持多态行为:比如你可以加
target_type()返回std::type_info,而void*没法知道原始类型 - 虚函数表带来一点间接跳转开销,但换来的是 RAII 安全和标准兼容性;
void*看似快,实则错误成本高得多 - 现代
std::function实现(如 libstdc++、libc++)已对常见情况(函数指针、无捕获 lambda)做特化,性能差距远小于教科书描述
类型擦除真正的复杂点不在“怎么擦”,而在“擦完之后怎么安全地还原行为”。虚函数只是手段,契约一致才是关键。漏掉任何一个生命周期操作(尤其是 destroy),就可能在 move/copy/析构时崩溃。











