Pandas 获取每行前 N 个最大值的列名（高效实现方案）

霞舞

发布时间：2026-02-03 16:55:21

820人浏览过

来源于php中文网

原创

Pandas 获取每行前 N 个最大值的列名（高效实现方案）

本文详解如何在 pandas 中高效获取 dataframe 每行数值列中前 n 个最大值对应的列名，解决 `apply + nlargest` 报错问题，并提供基于 `select_dtypes` 的稳健方案及 numpy 加速替代方法。

在使用 pandas.DataFrame.idxmax() 时需注意：它仅返回单个最大值的索引（即 top-1），无法直接扩展为 top-n。若需获取每行前 N 个最大值所在的列名（如本例中取 n=2），必须借助其他方法——常见误区是将 skipna 或 numeric_only 等参数错误传递给 df.apply()，导致 TypeError: unexpected keyword argument。

✅ 正确做法是：先用 df.select_dtypes('number') 安全筛选数值列（自动排除非数值类型，避免 nlargest 失败），再对每行应用 lambda 函数。关键在于 apply 本身不接受 skipna/numeric_only 参数，这些应由内部 Series 方法处理：

import pandas as pd
import numpy as np

df = pd.DataFrame({
    'consumption': [10.51, 103.11, 55.48], 
    'co2_emissions': [37.2, 19.66, 1712]
}, index=['Pork', 'Wheat Products', 'Beef'])

# ✅ 安全、清晰、推荐（适用于中小规模数据）
N = 2
result = (df.select_dtypes('number')
            .apply(lambda s: s.dropna().abs().nlargest(N).index.tolist(), axis=1))
print(result)

输出：

Pork              [co2_emissions, consumption]
Wheat Products    [consumption, co2_emissions]
Beef              [co2_emissions, consumption]
dtype: object

⚠️ 注意事项：

Upscale

AI图片放大工具

下载

s.abs().nlargest(N) 默认按绝对值排序；若需原始值大小（含符号），请去掉 .abs()；
s.dropna() 显式处理缺失值，比 skipna=True 更可靠（因 nlargest 默认已跳过 NaN）；
若存在多列同值并列第 N 名，nlargest 会按索引顺序截断，结果可能不唯一。

⚡ 高性能替代（适用于大数据量）：
当 DataFrame 行数极大（如 >10⁵）时，纯 NumPy 向量化操作显著快于 apply。以下方案利用 np.argpartition（O(n) 平均复杂度）替代全排序：

N = 2
tmp = df.select_dtypes('number')
cols = tmp.columns.to_numpy()
# 获取每行 top-N 列索引（未排序），再逆序得到降序排列
top_n_indices = np.argpartition(tmp, -N, axis=1)[:, -N:]
# 按值大小重排索引（确保列名按实际值从大到小排列）
sorted_indices = np.argsort(-tmp.values[np.arange(len(tmp))[:, None], top_n_indices], axis=1)
final_indices = top_n_indices[np.arange(len(tmp))[:, None], sorted_indices]

result_np = pd.Series(
    cols[final_indices].tolist(),
    index=df.index
)

该方法避免 Python 循环，在百万级数据上提速 3–5 倍。但可读性略低，建议在性能敏感场景使用。

? 总结：

idxmax ≠ top-n，勿强行扩展；
apply + nlargest 是直观解法，但须剥离 select_dtypes 和 dropna 保障鲁棒性；
生产环境大数据推荐 NumPy 向量化方案；
始终验证 abs() 是否符合业务逻辑（如负值是否需保留符号）。

Python自动化办公教程_ExcelWordPDF批量处理

如何用Python高效提取CSV数据并自动导入Word表格

如何高效地从CSV提取数据并自动导入Word生成表格

如何在Python中高效提取CSV数据并自动导入Word文档生成表格

如何用Python自动化将CSV数据导入并嵌入Word文档表格

相关标签:

word python 大数据 app 排列 numpy pandas 循环 Lambda 值类型 number

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：python解包操作_星号与双星号操作符在各类场景中的应用汇总下一篇：暂无

作者最新文章

如何使用 PHP 的 scandir() 实现递归目录遍历

2026-02-03 13:43

GoLang 中使用 yaml.v2 批量解析多个 YAML 文档结构

2026-02-03 13:50

酷狗音乐播放器如何在手机上调音量大小

2026-02-03 13:51

如何使用索引数组对数值数组进行动态插入排序

2026-02-03 13:55

GoLang 中使用 YAML.v2 解析多个结构体实例的完整教程

2026-02-03 14:14

如何在 WooCommerce 邮件模板中显示商品的完整尺寸图片（而非缩略图）

2026-02-03 14:25

如何在 Angular-Slickgrid 中同时启用行选择与单元格多选功能

2026-02-03 14:55

如何合并数组中具有相同 ID 的对象并聚合其字段值

2026-02-03 14:59

如何用 Python 绘制车辆行程的累计距离-时间连续折线图

2026-02-03 15:14

梦魇回归！《生化危机：安魂曲》短片现复仇女神身影

2026-02-03 15:32

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式，它可以在需要函数作为参数的地方使用，并提供了一种更简洁、更灵活的编码方式，其语法为“lambda 参数列表: 表达式”，参数列表是函数的参数，可以包含一个或多个参数，用逗号分隔，表达式是函数的执行体，用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容，供大家免费下载体验。

208

2023.09.15