如何筛选并保留至少包含一个“PC”值的行（基于指定列范围）

聖光之護

发布时间：2026-01-30 11:23:13

442人浏览过

来源于php中文网

原创

如何筛选并保留至少包含一个“PC”值的行（基于指定列范围）

本文介绍如何使用 pandas 的布尔索引高效筛选 dataframe 中在特定列范围内（如前12列）至少含一个“pc”字符串的行，避免低效循环和常见逻辑错误。

在实际数据清洗中，常需根据多列中是否出现某特定值来过滤行——例如，您希望仅保留那些在列 0 至 11（共12列）中至少有一列为 'PC' 的记录，而删除其余所有行。注意：这不是要求“所有列都是 'PC'”，而是“存在至少一列等于 'PC'”。

但原始尝试中存在几个典型误区：

❌ 使用 iterrows() + drop() 循环删除：不仅性能极差（50万+ 行时严重超时），还会因修改过程中索引变化导致 KeyError 或漏删；
❌ 写死单列条件（如 df[df['column'] == 'PC']）：仅检查一列，无法满足“任意一列含 'PC'”的需求；
❌ 误用 all() 逻辑：row.values 在 apply 中返回的是 pd.Series，'PC' in row.values 实际执行的是标签匹配而非值匹配，且 .all() 被错误用于“存在性”判断（应使用 .any()）。

✅ 正确解法是利用 向量化布尔索引，分三步完成：

定位目标列：用 df.iloc[:, :12] 提取前12列（即列索引 0 到 11）；
生成布尔矩阵：.ne('PC') 对每个元素判断「是否不等于 'PC'」，得到 True/False 矩阵；
按行聚合逻辑：.all(axis=1) 表示“该行所有列都不等于 'PC'” → 这正是我们要剔除的行；因此取反（~）即可保留至少含一个 'PC' 的行。

完整、高效、可读的代码如下：

NatAgent

AI数据情报监测与分析平台

下载

# ✅ 正确：保留在前12列中至少有一个'PC'的行
mask = df.iloc[:, :12].eq('PC').any(axis=1)  # 更直观：直接检查是否等于'PC'，再判断是否存在
df_filtered = df[mask].reset_index(drop=True)

? 提示：eq('PC') 比 ne('PC').all() 更语义清晰；any(axis=1) 直接表达“该行任一元素为 True”，正符合“存在 'PC'”的业务逻辑。

若需进一步限定列名（如明确列名为 '0', '1', ..., '11'），也可用列名列表方式，更安全：

pc_cols = [str(i) for i in range(12)]  # ['0','1',...,'11']
mask = df[pc_cols].eq('PC').any(axis=1)
df_filtered = df[mask].reset_index(drop=True)

⚠️ 注意事项：

确保目标列数据类型为 object（字符串），若含 NaN，eq('PC') 会自然返回 False，不影响 any() 判断；
避免在循环中修改原 DataFrame；所有过滤操作应一次性完成；
大数据集下，始终优先使用 .loc / .iloc + 向量化运算，而非 iterrows() 或 apply(..., axis=1)。

通过这一方法，您可在毫秒级完成对 50 万行数据的精准过滤，兼顾性能与可维护性。

Python dataclass 的设计初衷与实现机制

Python 自定义可迭代对象的正确姿势

Python 缓存失效策略设计

Python 多线程中的共享数据问题

Python 类型注解对运行时的影响

相关标签:

大数据 app 数据清洗 red pandas 数据类型 Object 字符串循环 column

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Google Cloud VM 上正确使用服务账号凭证调用自托管服务下一篇：如何在 Google Cloud VM 上使用服务账号凭证安全调用自托管服务

作者最新文章

如何在 Go 中运行测试并跳过指定子包

2026-01-29 16:04

战迹地图怎么添加多个坐标系-添加多个坐标系教程

2026-01-29 16:41

多邻国扣费如何关闭

2026-01-29 16:59

Python中print函数的默认分隔符导致制表符前多出空格

2026-01-29 17:16

全新3D偶像游戏《V Project》今日首曝，爱都于此触及

2026-01-29 17:21

华数tv会员连续包月能否取消

2026-01-29 17:29

e城e家怎么购物-e城e家购物流程

2026-01-29 17:30

抖音网页版如何在线观看短视频

2026-01-29 17:34

我的世界2026秒玩入口网址在哪

2026-01-29 17:36

为 CSS 下拉菜单正确添加圆角而不隐藏子菜单内容

2026-01-29 17:44

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

309

2023.10.31

php数据类型

本专题整合了php数据类型相关内容，阅读专题下面的文章了解更多详细内容。

222

2025.10.31

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

319

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

212

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1502

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

624

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

653

2024.03.22