set基于红黑树实现,插入时自动排序并去重。1. 插入元素时查找是否存在,存在则失败;2. 通过比较函数确定位置,保持有序;3. 使用平衡机制维持高效操作。

在C++中,set 是一个非常常用的关联式容器,它能够自动对插入的元素进行排序,并且保证元素的唯一性(即去重)。这个特性使得 set 在处理需要有序且不重复数据的场景中非常高效。下面我们来深入理解 set 的去重原理以及插入数据和自动排序的底层机制。
set 的去重原理
set 容器内部基于平衡二叉搜索树(通常是红黑树)实现。每当插入一个新元素时,set 会执行查找操作,判断该元素是否已经存在于树中:
- 如果元素已存在,则插入失败,不会添加重复值。
- 如果不存在,则创建新节点并插入到合适位置,保持树的平衡。
这种机制天然支持去重,不需要额外的判断逻辑。例如:
sets.insert(5);
s.insert(5); // 插入无效,set 中仍只有一个 5
最终 s 中只保留一个 5,第二次 insert 返回一个 pair 类型,second 为 false,表示插入未成功。
立即学习“C++免费学习笔记(深入)”;
set 如何实现自动排序
由于 set 底层使用的是二叉搜索树结构,每个节点的左子树所有值小于当前节点,右子树所有值大于当前节点。因此每次插入都会根据比较规则找到正确的位置,从而维持整体有序。
默认情况下,set 使用 less
bool operator()(const int& a, const int& b) const {
return a > b; // 降序
}
};
set
这样插入的数据就会按从大到小排序。
插入数据的过程详解
当调用 insert() 方法时,set 执行以下步骤:
- 从根节点开始,按照比较函数遍历树,寻找插入位置。
- 若发现相同值的节点,则停止插入,返回已有位置的迭代器。
- 若未找到,则插入新节点,并通过旋转等操作调整红黑树,保持平衡。
- 插入完成后,中序遍历仍然能得到有序序列。
由于红黑树的高度始终保持在 O(log n),所以每次插入、查找、删除的时间复杂度都是 O(log n),效率稳定。
注意事项与常见误区
需要注意的是,set 不允许修改已有元素的值,因为这可能破坏排序结构。正确的做法是先删除再插入。另外,如果你存放的是自定义类型(如 class 或 struct),必须提供有效的比较函数或重载操作符
基本上就这些。set 的设计让开发者无需关心排序和去重细节,只要合理使用,就能写出简洁高效的代码。









