希尔排序的核心是分组插入而非改进版冒泡,关键在于gap序列设计;推荐Knuth序列(1,4,13,40,…),用gap=3*gap+1逆向生成并倒序使用,避免退化,实测比原始序列快约30%。

希尔排序的核心是分组插入,不是“改进版冒泡”
很多人误以为希尔排序只是把插入排序改成跳着插,其实关键在 gap 序列的设计:它决定了数组被划分为多少组、每组多大跨度、以及最终能否稳定收敛到有序。直接用 gap = n/2, n/4, ..., 1 虽能跑通,但最坏情况仍是 O(n²),和普通插入排序没本质区别。
推荐用 Knuth 序列:gap = 3 * gap + 1 的逆向生成
Knuth 序列(1, 4, 13, 40, 121, ...)在实践中表现稳健,平均比较次数少,且避免了某些增量导致的“分组偏置”问题(比如全偶数 gap 可能让奇偶位置永远不交换)。生成时要从最大不超过 n 的值开始,倒序使用:
int gap = 1;
while (gap < n) gap = 3 * gap + 1;
while (gap >= 1) {
// 执行 gap-间隔的插入排序
for (int i = gap; i < n; ++i) {
int tmp = arr[i];
int j = i;
while (j >= gap && arr[j - gap] > tmp) {
arr[j] = arr[j - gap];
j -= gap;
}
arr[j] = tmp;
}
gap /= 3;
}-
gap初始不能设成n/2—— 这是 Shell 原始序列,已知在某些排列下退化严重 - 循环中用
gap /= 3而非gap >>= 1,确保按 Knuth 序列严格递减 - 内层插入排序必须从
i = gap开始,否则越界访问
为什么不能直接复用 std::sort 或手写普通插入排序逻辑?
标准库的 std::sort 是 introsort(快排+堆排+插入),不接受自定义间隔;而普通插入排序的 for (int i = 1; ...) 假设相邻比较,一旦换成 gap > 1,就必须重写内层移动逻辑——尤其是 arr[j] = arr[j - gap] 这步,错写成 arr[j] = arr[j - 1] 是常见崩溃点。
- 所有索引运算必须带
gap偏移,包括 while 条件中的j >= gap - 临时变量
tmp存的是arr[i],不是arr[0]或其他固定位置 - 若用
std::vector,注意.size()返回size_t,和int gap混用可能触发隐式转换警告
实测对比:不同增量对 10 万随机 int 排序的影响
在 clang++15 -O2 下,对 100,000 个 rand() % 10000 整数排序:
立即学习“C++免费学习笔记(深入)”;
- Shell 原始序列(
n/2, n/4, ...):约 420ms - Knuth 序列:约 290ms
- Hibbard 序列(
2^k - 1):约 310ms,但对已部分有序数据更敏感
差距看似不大,但在嵌入式或高频调用场景(如游戏帧内排序粒子),几十毫秒就是掉帧临界点。真正影响性能的不是外层循环次数,而是每轮 gap 下的元素移动总量——Knuth 序列让早期大步长就能打散局部有序块,减少后期小步长的搬运量。
增量序列不是随便选的常量,它是希尔排序里唯一可调的“杠杆”。写死 gap = n >> 1 就等于放弃算法优势。











