0

0

使用归并排序高效统计数组中不满足降序排列的数对

聖光之護

聖光之護

发布时间:2025-10-03 15:20:01

|

718人浏览过

|

来源于php中文网

原创

使用归并排序高效统计数组中不满足降序排列的数对

本文详细探讨了如何高效统计数组中不满足从大到小排序条件的数对,即满足 a[i] 排序算法,在 O(N log N) 的时间复杂度内完成计数,包括其核心计数原理、代码实现细节及性能优化,旨在提供一个全面的教程。

定义“不满足排序条件”的数对

在处理数组排序问题时,有时我们需要统计数组中特定类型的“异常”数对。本教程关注的是那些不满足“从大到小”排序条件的数对。具体来说,如果数组中存在两个元素 a[i] 和 a[j],满足以下两个条件:

  1. i
  2. a[i]

我们就称 (a[i], a[j]) 为一个“不满足从大到小排序条件的数对”,或者简称为“坏数对”。

示例:

  • 对于数组 hs = [7, 3, 5, 4, 1]:
    • 3
    • 3
  • 对于数组 hs = [8, 5, 6, 7, 2, 1]:
    • 5
    • 5
    • 6

理解这个定义是解决问题的关键。接下来,我们将探讨两种实现此计数的方法。

朴素的 O(N^2) 解决方案

最直接的思路是遍历数组中的所有可能的元素对 (a[i], a[j]),并检查它们是否满足“坏数对”的条件。这可以通过嵌套循环实现。

思路阐述: 外层循环从数组的第一个元素遍历到倒数第二个元素(i 从 0 到 length - 2)。内层循环从 i 的下一个元素开始遍历到数组末尾(j 从 i + 1 到 length - 1)。在内层循环中,比较 a[i] 和 a[j],如果 a[i]

代码示例:

public class BadPairCounter {

    /**
     * 使用双重循环统计数组中不满足从大到小排序条件的数对。
     * 时间复杂度为 O(N^2)。
     *
     * @param hs 输入数组
     * @return 坏数对的数量
     */
    public static int countBadPairsBruteForce(int[] hs) {
        int count = 0;
        for (int i = 0; i < hs.length; i++) {
            for (int j = i + 1; j < hs.length; j++) {
                // 比较当前元素 hs[i] 与其后面的所有元素 hs[j]
                if (hs[i] < hs[j]) {
                    // System.out.println("Found bad pair: (" + hs[i] + "," + hs[j] + ")"); // 可选:打印坏数对
                    count++;
                }
            }
        }
        return count;
    }

    public static void main(String[] args) {
        int[] arr1 = {7, 3, 5, 4, 1};
        System.out.println("Array: " + java.util.Arrays.toString(arr1) + ", Bad pairs (Brute Force): " + countBadPairsBruteForce(arr1)); // 预期输出 2

        int[] arr2 = {8, 5, 6, 7, 2, 1};
        System.out.println("Array: " + java.util.Arrays.toString(arr2) + ", Bad pairs (Brute Force): " + countBadPairsBruteForce(arr2)); // 预期输出 3
    }
}

优缺点分析:

  • 优点: 实现简单直观,易于理解和调试。
  • 缺点: 时间复杂度为 O(N^2),对于大型数组,性能会显著下降。当 N 达到数万甚至更高时,这种方法将变得不可接受。

基于归并排序的 O(N log N) 优化方案

为了提高性能,我们可以利用归并排序(Merge Sort)的分治思想。归并排序在合并(merge)两个已排序的子数组时,可以同时进行计数操作,从而将时间复杂度降低到 O(N log N)。

为何归并排序适合此问题: 归并排序的核心在于将一个大问题分解为两个独立的子问题,然后将子问题的结果合并。在合并过程中,我们正好有机会比较来自不同子数组的元素,这正是统计“坏数对”所需要的。当我们合并两个子数组时,如果一个元素来自左子数组,另一个元素来自右子数组,并且它们满足 a[i]

归并排序核心逻辑与计数原理:

  1. 递归分解: 将数组递归地分成两半,直到每个子数组只包含一个元素。单个元素的数组不存在“坏数对”,计数为 0。
  2. 合并阶段的计数(关键): 这是算法的核心。当我们将两个已排序(这里我们选择降序排序,以便于计数)的子数组 l 和 r 合并成一个大的有序数组 a 时,我们进行计数。
    • 我们使用两个指针 lIdx 和 rIdx 分别指向 l 和 r 的当前元素。
    • 我们希望将 a 排序成降序。因此,每次比较 l[lIdx] 和 r[rIdx] 时:
      • 如果 l[lIdx] >= r[rIdx]:说明 l[lIdx] 更大或相等,应该先放入 a。此时,l[lIdx] 与 r 中任何元素都不会形成“坏数对”(因为 l[lIdx] 至少不小于 r[rIdx],而 r 中的后续元素会更小或相等)。我们将 l[lIdx] 放入 a,并移动 lIdx。
      • 如果 l[lIdx] 此时,关键的计数发生了! 因为 r[rIdx] 比 l[lIdx] 大,并且 l[lIdx] 在原数组中出现在 r[rIdx] 之前(因为 l 是左半部分,r 是右半部分)。更重要的是,由于 l 数组本身是降序排列的,所以 l[lIdx] 及其之后的所有 l 数组中剩余的元素 (l[lIdx+1], l[lIdx+2], ...) 都将小于或等于 l[lIdx]。因此,所有这些 l 数组中剩余的元素都将小于 r[rIdx]。所以,r[rIdx] 与 l 数组中从 lIdx 开始到末尾的所有元素都形成了“坏数对”。我们将这些坏数对的数量加到总计数中:count += (l.length - lIdx)。然后将 r[rIdx] 放入 a,并移动 rIdx。
    • 当一个子数组遍历完后,将另一个子数组中剩余的元素直接放入 a。这些操作不会产生新的“坏数对”计数,因为它们不再是跨子数组的比较。
  3. 累积结果: 每次 mergeSort 调用都会返回其子数组和自身合并阶段产生的“坏数对”数量,这些数量需要逐层累加。

代码示例(Java):

import java.util.Arrays;

public class BadPairMergeSortCounter {

    /**
     * 主入口函数,调用归并排序进行坏数对计数。
     * 为了避免修改原始数组,建议在外部进行数组复制。
     *
     * @param hs 输入数组
     * @return 坏数对的数量
     */
    public static int countBadPairsMergeSort(int[] hs) {
        // 为了避免修改原始数组,先复制一份
        int[] tempArray = Arrays.copyOf(hs, hs.length);
        return mergeSortAndCount(tempArray, tempArray.length);
    }

    /**
     * 归并排序的核心递归函数,同时进行坏数对计数。
     *
     * @param a 待排序和计数的数组片段
     * @param n 数组片段的长度
     * @return 当前片段及其子片段中坏数对的总数
     */
    private static int mergeSortAndCount(int[] a, int n) {
        if (n <= 1) { // 数组长度为0或1时,没有坏数对
            return 0;
        }

        int mid = n / 2;
        int[] l = new int[mid];
        int[] r = new int[n - mid];

        // 使用 System.arraycopy 提高效率
        System.arraycopy(a, 0, l, 0, mid);
        if (n - mid > 0) { // 确保右半部分有元素
            System.arraycopy(a, mid, r, 0, n - mid);
        }

        // 递归计算左右子数组中的坏数对,并累加
        int totalBadPairs = 0;
        totalBadPairs += mergeSortAndCount(l, mid);
        totalBadPairs += mergeSortAndCount(r, n - mid);

        // 合并左右子数组并计算跨子数组的坏数对
        totalBadPairs += mergeAndCount(a, l, r);
        return totalBadPairs;
    }

    /**
     * 合并两个已排序(降序)的子数组,并计算跨子数组的坏数对。
     *
     * @param a 目标数组,用于存放合并后的结果
     * @param l 左子数组
     * @param r 右子数组
     * @return 跨左右子数组产生的坏

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

198

2023.11.20

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

391

2023.09.04

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

924

2023.09.19

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

PHP 高并发与性能优化
PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优,内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例(如高并发接口优化、缓存系统设计、秒杀活动实现),帮助学习者掌握 构建高性能PHP后端系统的核心能力。

101

2025.10.16

PHP 数据库操作与性能优化
PHP 数据库操作与性能优化

本专题聚焦于PHP在数据库开发中的核心应用,详细讲解PDO与MySQLi的使用方法、预处理语句、事务控制与安全防注入策略。同时深入分析SQL查询优化、索引设计、慢查询排查等性能提升手段。通过实战案例帮助开发者构建高效、安全、可扩展的PHP数据库应用系统。

86

2025.11.13

JavaScript 性能优化与前端调优
JavaScript 性能优化与前端调优

本专题系统讲解 JavaScript 性能优化的核心技术,涵盖页面加载优化、异步编程、内存管理、事件代理、代码分割、懒加载、浏览器缓存机制等。通过多个实际项目示例,帮助开发者掌握 如何通过前端调优提升网站性能,减少加载时间,提高用户体验与页面响应速度。

29

2025.12.30

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

109

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.9万人学习

C# 教程
C# 教程

共94课时 | 7.7万人学习

Java 教程
Java 教程

共578课时 | 51.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号