std::lower_bound返回首个≥目标值的迭代器,需确保范围升序、检查it!=end()、转下标用it-begin();与upper_bound配合可安全获取重复元素区间;查存在应使用binary_search而非比较结果。

std::lower_bound 用法和常见误用
它不返回“是否找到”,而是返回第一个 ≥ 目标值的迭代器位置;用错 std::lower_bound 最常导致越界或逻辑反向——比如把 == 当成查找成功的判断依据。
- 必须保证输入范围已升序排列,否则行为未定义(不是报错,是结果不可预测)
- 返回值是迭代器,不是下标:要转下标得写
it - vec.begin(),直接解引用前务必检查it != vec.end() - 如果所有元素都小于目标值,
std::lower_bound返回vec.end(),此时解引用必崩
std::vector<int> v = {1, 2, 4, 4, 5};
auto it = std::lower_bound(v.begin(), v.end(), 4);
int pos = it - v.begin(); // pos == 2,不是 0 或 1和 std::upper_bound 的关键区别
两者都做二分,但语义不同:std::lower_bound 找“第一个不小于”,std::upper_bound 找“第一个大于”;合起来才能安全框出重复值区间。
- 对重复元素
{3,4,4,4,5}查4:lower_bound指向第一个4,upper_bound指向5 -
std::distance(lower, upper)就是4出现次数,比手写循环数快且无边界风险 - 别用
lower_bound配!=判断“是否存在”——它只管位置,不管相等;真要查存在,用std::binary_search
自定义比较函数时的陷阱
传入的比较函数必须满足严格弱序,且和排序时用的完全一致;否则 std::lower_bound 可能跳过合法位置或无限循环(极少见但可能)。
- 升序查就用
std::less{}或默认;降序查必须用std::greater{},且原容器也得是降序排好的 - 自定义结构体时,比较函数参数顺序不能反:
bool cmp(const T& a, const T& b)表示 “a 是否应排在 b 前面”,不是 “a 是否等于 b” - lambda 捕获需谨慎:若 lambda 捕获了局部变量,而迭代器生命周期超出该变量作用域,运行时可能读到垃圾值
性能与替代方案权衡
它时间复杂度稳定 O(log n),但前提是随机访问迭代器(std::vector、std::array OK,std::list 不行);对小数组(比如 size
立即学习“C++免费学习笔记(深入)”;
-
std::lower_bound对std::vector是最优选择;对std::set/std::map,直接用成员函数lower_bound,它内部是红黑树导航,不走泛型算法路径 - 编译器无法对泛型
std::lower_bound做 vectorization,大数据量时若允许预处理,可考虑std::span+ 手写分支预测友好的二分(但极少需要) - 调试时别只看返回值,用
std::is_sorted快速验证输入是否真有序——这是 80% 的“找不到”问题根源
边界检查和比较逻辑一致性,比记住函数名更重要。写完先想清楚:我到底要“定位”还是“判存”,再选对应工具。









