Python缺失值比例怎么算_DataFrame快速统计各列空值率与可视化方法

P粉602998670

发布时间：2026-03-16 11:51:01

668人浏览过

来源于php中文网

原创

df.isnull().mean()可直接计算每列缺失值比例，因True/False被转为1/0求均值；支持切片、精度控制及绘图，但需注意伪缺失和混合类型问题。

python缺失值比例怎么算_dataframe快速统计各列空值率与可视化方法

怎么用 `isnull()` 和 `mean()` 一行算出每列缺失值比例

直接对布尔矩阵求均值，是最快最稳的方式：df.isnull().mean()。因为 True 被当 1、False 当 0 处理，均值就是空值占比。

别用 sum() / len(df) —— 容易因索引不连续或含重复行导致分母不准
如果只关心某几列，先切片再调用：df[['col_a', 'col_b']].isnull().mean()
结果是 float64 类型的 Series，默认保留小数点后 6 位；需要控制精度可链式调用 .round(4)
注意：NaN、None、pd.NaT 都会被识别为缺失；但字符串 'NaN' 或空字符串 '' 不算

为什么 `df.info()` 显示非空数却算不出比例

df.info() 输出的是每列的非空计数（non-null），但它不直接提供比例，而且默认只打印前/后若干行，容易漏看长 DataFrame 中间列的缺失情况。

尤其当列数多于显示阈值（默认约 80 列），中间大量列的 non-null 值根本不会出现
df.info(verbose=True) 可强制全量输出，但仍是文本格式，没法直接参与后续计算或绘图
真正要批量分析或导出，还是得靠 df.isnull().mean() + to_frame() 转成结构化数据

用 `matplotlib` 或 `seaborn` 快速画缺失率条形图

把缺失率转成 DataFrame 后，就能直接喂给绘图库。关键是要设好 x 轴标签旋转，否则列名挤在一起看不见。

Machine Translation

聚合多个来源的AI翻译

下载

推荐写法：

missing_rate = df.isnull().mean().round(4).to_frame('missing_ratio')<br>missing_rate.plot(kind='barh', figsize=(6, 8))<br>plt.xlabel('Missing Ratio')</br>plt.xticks(rotation=0)

用 seaborn 更简洁：

sns.barplot(data=missing_rate.reset_index(), y='index', x='missing_ratio')

别直接对 Series 调用 .plot() 后加 plt.yticks() —— 列名顺序可能错乱，尤其当列名含中文或特殊字符时
如果缺失率全为 0，图表会塌成一条线；建议加个判断：if missing_rate.max() == 0: print("No missing values found")

处理 `object` 列里隐藏的“伪缺失”（如空格、'NULL' 字符串）

isnull() 对这类值完全免疫，它们会算作有效值，导致真实缺失率被低估。

立即学习“Python免费学习笔记（深入）”；

先检查是否有明显可疑值：df.select_dtypes('object').apply(lambda s: s.str.strip().isin(['', 'NULL', 'null', 'None']).sum())
清洗后再统计：df_clean = df.copy(); df_clean[col] = df_clean[col].str.strip().replace({'NULL': pd.NA, 'null': pd.NA})
注意：replace() 默认不修改原 Series，必须赋值；且 pd.NA 是 pandas 的新缺失标记，比 np.nan 更兼容字符串列
混合类型列（如既有数字又有字符串）可能被推断为 object，但 str 方法会报错；需加 astype(str) 或用 apply(type) 排查

空值率本身不难算，难点在于“哪些值该被当成缺失”——这取决于业务逻辑，不是技术能自动判断的。每次跑 df.isnull().mean() 前，最好先用 df.head().T 和 df.dtypes 扫一眼数据长什么样。

Python 多设备并行控制 Android（真机/模拟器）的高效实践方案

Python asyncio怎么用_async def定义协程函数与await挂起等待异步操作解析

Python匿名函数怎么写_lambda表达式与高阶函数结合

正则表达式中贪婪匹配与回溯陷阱：如何精准捕获“c+后接至少3个b”的最长前缀

Python怎么在服务器上运行_CentOS/宝塔面板Python环境配置

相关标签:

python pandas matplotlib print Object NULL if 字符串 Lambda 切片 len copy

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何高效地基于索引区间对 NumPy 数组进行向量化累加下一篇：暂无

作者最新文章

Java中的SynchronousQueue有什么特点_容量为0的线程间直接握手传递通道

2026-03-16 09:55

Java基础如何手写一个简单的记事本程序_IO字符流读写与File类文件操作

2026-03-16 09:55

mysql如何备份表结构不包含数据_mysql --no-data参数

2026-03-16 09:56

如何在Golang中控制函数内联Inlining Go语言gcflags参数详解

2026-03-16 09:56

PostgreSQL在Navicat中如何修改已有表结构_高级特性支持

2026-03-16 09:57

怎么设置MongoDB客户端读取操作的过时容忍度_maxStalenessSeconds详解

2026-03-16 09:57

Navicat连Redis出现中文乱码怎么办_字符集编码调整

2026-03-16 09:57

如何配置Active Data Guard_备库实时查询与只读打开模式实现

2026-03-16 09:58

怎么优化远程服务器的开启备份文件加密保护_降低延迟与丢包率

2026-03-16 09:58

如何在Java接口中定义静态方法_工具方法的封装与调用规范

2026-03-16 09:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

193

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1132

2024.03.01

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

847

2023.08.22

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开，系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制，同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解，帮助开发者掌握构建稳定高效并发系统的关键技术。

2026.03.16

热门下载

网站特效

网站源码

网站素材

前端模板

Python缺失值比例怎么算_DataFrame快速统计各列空值率与可视化方法

怎么用 isnull() 和 mean() 一行算出每列缺失值比例

为什么 df.info() 显示非空数却算不出比例

用 matplotlib 或 seaborn 快速画缺失率条形图

处理 object 列里隐藏的“伪缺失”（如空格、'NULL' 字符串）

怎么用 `isnull()` 和 `mean()` 一行算出每列缺失值比例

为什么 `df.info()` 显示非空数却算不出比例

用 `matplotlib` 或 `seaborn` 快速画缺失率条形图

处理 `object` 列里隐藏的“伪缺失”（如空格、'NULL' 字符串）