详解BinarySearch二分查找算法_在有序集合中快速定位元素的原理

P粉602998670

发布时间：2026-02-16 12:11:20

403人浏览过

来源于php中文网

原创

binarysearch必须要求数组有序，因为其核心逻辑依赖中间值划分有序区间；无序时排除一半数据无效，降序或部分有序需额外处理；防溢出应使用mid = left + (right - left) / 2；返回值设计兼顾存在性与插入点，重复元素时位置不固定。

详解binarysearch二分查找算法_在有序集合中快速定位元素的原理

为什么 `binarySearch` 一定要求数组有序？

因为算法每一步都依赖“中间值能划分左右区域”的逻辑：如果 arr[mid] > target，它就默认所有右边的数都更大——这只有在升序时才成立。一旦无序，mid 左右两边毫无规律，排除一半数据就成了瞎猜。

降序数组不能直接用标准 binarySearch，要么先反转，要么改比较逻辑（比如把 target 改成 <code>target > arr[mid]）
部分有序（如旋转数组）需先定位断点，再分段二分，不能跳过预处理
Java 的 Collections.binarySearch() 和 Python 的 bisect 模块都明确要求输入已排序，否则返回值无意义，甚至越界

`mid = left + (right - left) / 2` 而不是 `(left + right) / 2`

这是防整数溢出的关键细节。当 left 和 right 都接近 Integer.MAX_VALUE（约 21 亿）时，left + right 会溢出变负数，导致 mid 错误，进而索引越界或死循环。

几乎所有现代实现（JDK、Go sort.Search、Rust slice::binary_search）都用减法形式
在 C/C++ 中尤其危险；Java 8+ 的 Arrays.binarySearch 内部也如此实现
即使当前数据量小，也建议统一写法，避免未来迁移或边界扩展时翻车

查不到时返回 `-1` 还是 `-(insertionPoint + 1)`？

返回 -1 是最简语义（“没找到”），但很多场景需要知道“它该插在哪”。比如维护有序列表、计算排名、找前驱后继——这时返回插入位置的补码更实用。

今天学点啥

秘塔AI推出的AI学习助手

下载

Java 的 Arrays.binarySearch() 就是后者：若返回负值 r，则插入点为 -r - 1
Python bisect.bisect_left() 直接返回插入索引，不加转换，语义更直白
自己实现时，若只关心“是否存在”，返回 -1 足够；若后续要插入或求 rank，务必保留插入点信息

重复元素时 `binarySearch` 返回哪个位置？

标准实现不保证返回第一个或最后一个——它只保证返回“某个匹配位置”。比如数组 [2, 4, 4, 4, 6] 查 4，可能返回索引 1、2 或 3，取决于中间点怎么落。

要找第一次出现位置，得用左边界二分：while (left ，并保持 <code>arr[mid] >= target 时收缩右边界
要找最后一次出现位置，用右边界二分：while (left ，条件改为 <code>arr[mid]
Java 的 Arrays.binarySearch 不提供边界变体；需手写或借助 Arrays.binarySearch 配合 while 向左/右扫描（但最坏退化为 O(n)）

实际写的时候，最容易漏掉的是：没验证输入是否真有序，以及混淆了“查找存在性”和“查找插入点”两种语义。这两个点不靠测试很难暴露，一上线就静默错。

相关标签:

rust Integer sort while 循环算法

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在线性时间内用纯数组找出最大值的重复次数下一篇：详解Java中的FileSystemException_文件系统读写权限或路径过长的报错

作者最新文章

手机QQ缓存文件怎么清理_释放QQ占用内存空间与深度清理教程

2026-02-13 16:11

漫蛙Manwa漫画入口地址_漫蛙漫画官网登录页面集合

2026-02-13 16:12

2026春节后快递什么时候能送到_各快递节后恢复正常派送安排

2026-02-13 16:13

妖精漫画正版阅读入口_快速访问妖精漫画官方网站页面

2026-02-13 16:13

日志集中管理_配置rsyslog将日志发送到远程服务器

2026-02-13 16:41

轻量级虚拟化_KVM在麒麟OS上的安装与配置

2026-02-13 16:47

麒麟OS文件系统_ext4与NTFS的区别与兼容

2026-02-13 16:54

UOS安装模式选择_全盘安装与手动分区的利弊分析

2026-02-13 17:05

数据恢复工具_麒麟OS下Ext4分区数据误删恢复

2026-02-13 17:28

银河麒麟 vs 统信UOS_两大国产系统深度对比，谁更适合你？

2026-02-13 17:44

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

C++系统编程内存管理_C++系统编程怎么与Rust竞争内存安全

C++系统编程中的内存管理是指对程序运行时内存的申请、使用和释放进行精细控制的机制，涵盖了栈、堆、静态区等不同区域，开发者需要通过new/delete、智能指针或内存池等方式管理动态内存，以避免内存泄漏、野指针等问题，确保程序高效稳定运行。它核心在于开发者对低层内存有完全控制权，带来灵活性，但也伴随高责任，是C++性能优化的关键。

2025.12.22

Rust异步编程与Tokio运行时实战

本专题聚焦 Rust 语言的异步编程模型，深入讲解 async/await 机制与 Tokio 运行时的核心原理。内容包括异步任务调度、Future 执行模型、并发安全、网络 IO 编程以及高并发场景下的性能优化。通过实战示例，帮助开发者使用 Rust 构建高性能、低延迟的后端服务与网络应用。

2026.02.11

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

399

2023.09.04