使用归并排序高效统计数组中不满足降序排列的数对

聖光之護

发布时间：2025-10-03 15:20:01

718人浏览过

来源于php中文网

原创

使用归并排序高效统计数组中不满足降序排列的数对

本文详细探讨了如何高效统计数组中不满足从大到小排序条件的数对，即满足 a[i] 排序算法，在 O(N log N) 的时间复杂度内完成计数，包括其核心计数原理、代码实现细节及性能优化，旨在提供一个全面的教程。

定义“不满足排序条件”的数对

在处理数组排序问题时，有时我们需要统计数组中特定类型的“异常”数对。本教程关注的是那些不满足“从大到小”排序条件的数对。具体来说，如果数组中存在两个元素 a[i] 和 a[j]，满足以下两个条件：

i
a[i]

我们就称 (a[i], a[j]) 为一个“不满足从大到小排序条件的数对”，或者简称为“坏数对”。

示例：

对于数组 hs = [7, 3, 5, 4, 1]：
- 3
- 3
对于数组 hs = [8, 5, 6, 7, 2, 1]：
- 5
- 5
- 6

理解这个定义是解决问题的关键。接下来，我们将探讨两种实现此计数的方法。

朴素的 O(N^2) 解决方案

最直接的思路是遍历数组中的所有可能的元素对 (a[i], a[j])，并检查它们是否满足“坏数对”的条件。这可以通过嵌套循环实现。

思路阐述： 外层循环从数组的第一个元素遍历到倒数第二个元素（i 从 0 到 length - 2）。内层循环从 i 的下一个元素开始遍历到数组末尾（j 从 i + 1 到 length - 1）。在内层循环中，比较 a[i] 和 a[j]，如果 a[i]

代码示例：

PPT.CN,PPTCN,PPT.CN是什么,PPT.CN官网,PPT.CN如何使用

一键操作，智能生成专业级PPT

下载

public class BadPairCounter {

    /**
     * 使用双重循环统计数组中不满足从大到小排序条件的数对。
     * 时间复杂度为 O(N^2)。
     *
     * @param hs 输入数组
     * @return 坏数对的数量
     */
    public static int countBadPairsBruteForce(int[] hs) {
        int count = 0;
        for (int i = 0; i < hs.length; i++) {
            for (int j = i + 1; j < hs.length; j++) {
                // 比较当前元素 hs[i] 与其后面的所有元素 hs[j]
                if (hs[i] < hs[j]) {
                    // System.out.println("Found bad pair: (" + hs[i] + "," + hs[j] + ")"); // 可选：打印坏数对
                    count++;
                }
            }
        }
        return count;
    }

    public static void main(String[] args) {
        int[] arr1 = {7, 3, 5, 4, 1};
        System.out.println("Array: " + java.util.Arrays.toString(arr1) + ", Bad pairs (Brute Force): " + countBadPairsBruteForce(arr1)); // 预期输出 2

        int[] arr2 = {8, 5, 6, 7, 2, 1};
        System.out.println("Array: " + java.util.Arrays.toString(arr2) + ", Bad pairs (Brute Force): " + countBadPairsBruteForce(arr2)); // 预期输出 3
    }
}

优缺点分析：

优点： 实现简单直观，易于理解和调试。
缺点： 时间复杂度为 O(N^2)，对于大型数组，性能会显著下降。当 N 达到数万甚至更高时，这种方法将变得不可接受。

基于归并排序的 O(N log N) 优化方案

为了提高性能，我们可以利用归并排序（Merge Sort）的分治思想。归并排序在合并（merge）两个已排序的子数组时，可以同时进行计数操作，从而将时间复杂度降低到 O(N log N)。

为何归并排序适合此问题： 归并排序的核心在于将一个大问题分解为两个独立的子问题，然后将子问题的结果合并。在合并过程中，我们正好有机会比较来自不同子数组的元素，这正是统计“坏数对”所需要的。当我们合并两个子数组时，如果一个元素来自左子数组，另一个元素来自右子数组，并且它们满足 a[i]

归并排序核心逻辑与计数原理：

递归分解： 将数组递归地分成两半，直到每个子数组只包含一个元素。单个元素的数组不存在“坏数对”，计数为 0。
合并阶段的计数（关键）： 这是算法的核心。当我们将两个已排序（这里我们选择降序排序，以便于计数）的子数组 l 和 r 合并成一个大的有序数组 a 时，我们进行计数。
- 我们使用两个指针 lIdx 和 rIdx 分别指向 l 和 r 的当前元素。
- 我们希望将 a 排序成降序。因此，每次比较 l[lIdx] 和 r[rIdx] 时：
  - 如果 l[lIdx] >= r[rIdx]：说明 l[lIdx] 更大或相等，应该先放入 a。此时，l[lIdx] 与 r 中任何元素都不会形成“坏数对”（因为 l[lIdx] 至少不小于 r[rIdx]，而 r 中的后续元素会更小或相等）。我们将 l[lIdx] 放入 a，并移动 lIdx。
  - 如果 l[lIdx] 此时，关键的计数发生了！因为 r[rIdx] 比 l[lIdx] 大，并且 l[lIdx] 在原数组中出现在 r[rIdx] 之前（因为 l 是左半部分，r 是右半部分）。更重要的是，由于 l 数组本身是降序排列的，所以 l[lIdx] 及其之后的所有 l 数组中剩余的元素 (l[lIdx+1], l[lIdx+2], ...) 都将小于或等于 l[lIdx]。因此，所有这些 l 数组中剩余的元素都将小于 r[rIdx]。所以，r[rIdx] 与 l 数组中从 lIdx 开始到末尾的所有元素都形成了“坏数对”。我们将这些坏数对的数量加到总计数中：count += (l.length - lIdx)。然后将 r[rIdx] 放入 a，并移动 rIdx。
- 当一个子数组遍历完后，将另一个子数组中剩余的元素直接放入 a。这些操作不会产生新的“坏数对”计数，因为它们不再是跨子数组的比较。
累积结果： 每次 mergeSort 调用都会返回其子数组和自身合并阶段产生的“坏数对”数量，这些数量需要逐层累加。

代码示例（Java）：

import java.util.Arrays;

public class BadPairMergeSortCounter {

    /**
     * 主入口函数，调用归并排序进行坏数对计数。
     * 为了避免修改原始数组，建议在外部进行数组复制。
     *
     * @param hs 输入数组
     * @return 坏数对的数量
     */
    public static int countBadPairsMergeSort(int[] hs) {
        // 为了避免修改原始数组，先复制一份
        int[] tempArray = Arrays.copyOf(hs, hs.length);
        return mergeSortAndCount(tempArray, tempArray.length);
    }

    /**
     * 归并排序的核心递归函数，同时进行坏数对计数。
     *
     * @param a 待排序和计数的数组片段
     * @param n 数组片段的长度
     * @return 当前片段及其子片段中坏数对的总数
     */
    private static int mergeSortAndCount(int[] a, int n) {
        if (n <= 1) { // 数组长度为0或1时，没有坏数对
            return 0;
        }

        int mid = n / 2;
        int[] l = new int[mid];
        int[] r = new int[n - mid];

        // 使用 System.arraycopy 提高效率
        System.arraycopy(a, 0, l, 0, mid);
        if (n - mid > 0) { // 确保右半部分有元素
            System.arraycopy(a, mid, r, 0, n - mid);
        }

        // 递归计算左右子数组中的坏数对，并累加
        int totalBadPairs = 0;
        totalBadPairs += mergeSortAndCount(l, mid);
        totalBadPairs += mergeSortAndCount(r, n - mid);

        // 合并左右子数组并计算跨子数组的坏数对
        totalBadPairs += mergeAndCount(a, l, r);
        return totalBadPairs;
    }

    /**
     * 合并两个已排序（降序）的子数组，并计算跨子数组的坏数对。
     *
     * @param a 目标数组，用于存放合并后的结果
     * @param l 左子数组
     * @param r 右子数组
     * @return 跨左右子数组产生的坏

在Java里什么是封装思想_Java封装特性实现方式说明

在Java里什么时候不应该使用异常_Java异常使用边界解析

在Java里如何定义常量_Javafinal关键字用法说明

Java多态中成员变量和成员方法的访问特点

在Java中实现简单配置管理工具_JavaIO与对象封装实战

相关专题

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

198

2023.11.20

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

391

2023.09.04

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

924

2023.09.19

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

407

2023.08.14

PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优，内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例（如高并发接口优化、缓存系统设计、秒杀活动实现），帮助学习者掌握构建高性能PHP后端系统的核心能力。

101

2025.10.16

PHP 数据库操作与性能优化

本专题聚焦于PHP在数据库开发中的核心应用，详细讲解PDO与MySQLi的使用方法、预处理语句、事务控制与安全防注入策略。同时深入分析SQL查询优化、索引设计、慢查询排查等性能提升手段。通过实战案例帮助开发者构建高效、安全、可扩展的PHP数据库应用系统。

2025.11.13

JavaScript 性能优化与前端调优

本专题系统讲解 JavaScript 性能优化的核心技术，涵盖页面加载优化、异步编程、内存管理、事件代理、代码分割、懒加载、浏览器缓存机制等。通过多个实际项目示例，帮助开发者掌握如何通过前端调优提升网站性能，减少加载时间，提高用户体验与页面响应速度。

2025.12.30

Python 自然语言处理（NLP）基础与实战

本专题系统讲解 Python 在自然语言处理（NLP）领域的基础方法与实战应用，涵盖文本预处理（分词、去停用词）、词性标注、命名实体识别、关键词提取、情感分析，以及常用 NLP 库（NLTK、spaCy）的核心用法。通过真实文本案例，帮助学习者掌握使用 Python 进行文本分析与语言数据处理的完整流程，适用于内容分析、舆情监测与智能文本应用场景。

2026.01.27