0

0

Python缺失值比例怎么算_DataFrame快速统计各列空值率与可视化方法

P粉602998670

P粉602998670

发布时间:2026-03-16 11:51:01

|

668人浏览过

|

来源于php中文网

原创

df.isnull().mean()可直接计算每列缺失值比例,因True/False被转为1/0求均值;支持切片、精度控制及绘图,但需注意伪缺失和混合类型问题。

python缺失值比例怎么算_dataframe快速统计各列空值率与可视化方法

怎么用 isnull()mean() 一行算出每列缺失值比例

直接对布尔矩阵求均值,是最快最稳的方式:df.isnull().mean()。因为 True 被当 1、False 当 0 处理,均值就是空值占比。

  • 别用 sum() / len(df) —— 容易因索引不连续或含重复行导致分母不准
  • 如果只关心某几列,先切片再调用:df[['col_a', 'col_b']].isnull().mean()
  • 结果是 float64 类型的 Series,默认保留小数点后 6 位;需要控制精度可链式调用 .round(4)
  • 注意:NaNNonepd.NaT 都会被识别为缺失;但字符串 'NaN' 或空字符串 '' 不算

为什么 df.info() 显示非空数却算不出比例

df.info() 输出的是每列的非空计数(non-null),但它不直接提供比例,而且默认只打印前/后若干行,容易漏看长 DataFrame 中间列的缺失情况。

  • 尤其当列数多于显示阈值(默认约 80 列),中间大量列的 non-null 值根本不会出现
  • df.info(verbose=True) 可强制全量输出,但仍是文本格式,没法直接参与后续计算或绘图
  • 真正要批量分析或导出,还是得靠 df.isnull().mean() + to_frame() 转成结构化数据

matplotlibseaborn 快速画缺失率条形图

把缺失率转成 DataFrame 后,就能直接喂给绘图库。关键是要设好 x 轴标签旋转,否则列名挤在一起看不见。

Machine Translation
Machine Translation

聚合多个来源的AI翻译

下载
  • 推荐写法:
    missing_rate = df.isnull().mean().round(4).to_frame('missing_ratio')<br>missing_rate.plot(kind='barh', figsize=(6, 8))<br>plt.xlabel('Missing Ratio')</br>plt.xticks(rotation=0)
  • seaborn 更简洁:
    sns.barplot(data=missing_rate.reset_index(), y='index', x='missing_ratio')
  • 别直接对 Series 调用 .plot() 后加 plt.yticks() —— 列名顺序可能错乱,尤其当列名含中文或特殊字符时
  • 如果缺失率全为 0,图表会塌成一条线;建议加个判断:if missing_rate.max() == 0: print("No missing values found")

处理 object 列里隐藏的“伪缺失”(如空格、'NULL' 字符串)

isnull() 对这类值完全免疫,它们会算作有效值,导致真实缺失率被低估。

立即学习Python免费学习笔记(深入)”;

  • 先检查是否有明显可疑值:df.select_dtypes('object').apply(lambda s: s.str.strip().isin(['', 'NULL', 'null', 'None']).sum())
  • 清洗后再统计:df_clean = df.copy(); df_clean[col] = df_clean[col].str.strip().replace({'NULL': pd.NA, 'null': pd.NA})
  • 注意:replace() 默认不修改原 Series,必须赋值;且 pd.NA 是 pandas 的新缺失标记,比 np.nan 更兼容字符串列
  • 混合类型列(如既有数字又有字符串)可能被推断为 object,但 str 方法会报错;需加 astype(str) 或用 apply(type) 排查
空值率本身不难算,难点在于“哪些值该被当成缺失”——这取决于业务逻辑,不是技术能自动判断的。每次跑 df.isnull().mean() 前,最好先用 df.head().Tdf.dtypes 扫一眼数据长什么样。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

82

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

34

2026.01.31

python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1132

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

2

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号