0

0

如何在 Polars 中高效选取除指定列外的所有整数类型列

聖光之護

聖光之護

发布时间:2026-01-29 21:13:00

|

122人浏览过

|

来源于php中文网

原创

如何在 Polars 中高效选取除指定列外的所有整数类型列

本文介绍使用 polars 列选择器(selectors)配合 `exclude()` 方法,一键筛选出所有整数类型列并排除特定列(如 `'p'` 和 `'z'`),避免手动列举,适用于百列级 dataframe。

在 Polars 中处理大规模结构化数据时,经常需要按数据类型批量操作列——例如,对所有整数列统一做归一化、统计或类型校验。但若需「选取所有整数列,同时排除若干特例列」,硬编码列名不仅易错,更难以维护。幸运的是,Polars 提供了强大且语义清晰的列选择器(column selectors)机制,配合链式表达式,可实现简洁、高效、可读性强的一行式解决方案。

核心思路是:先用 cs.integer() 构建一个匹配所有整数类型(i8/i16/i32/i64 等)列的选择器,再通过 .exclude("p", "z") 显式剔除不需要的列。整个过程完全惰性执行,无中间副本,性能优异。

以下为完整示例代码:

import polars as pl
import polars.selectors as cs

df = pl.DataFrame(
    {
        'p': [1, 2, 1, 3, 1, 2],
        'x': list(range(6, 0, -1)),
        'y': list(range(2, 8)),
        'z': [3, 4, 5, 6, 7, None],  # 注意:含 null,但 dtype 仍为 i64
        "q": list('abcdef')
    }
)

# ✅ 推荐做法:选取所有整数列,排除 'p' 和 'z'
result = df.select(cs.integer().exclude("p", "z"))
print(result)

输出:

Akkio
Akkio

Akkio 是一个无代码 AI 的全包平台,任何人都可以在几分钟内构建和部署AI

下载
shape: (6, 2)
┌─────┬─────┐
│ x   ┆ y   │
│ --- ┆ --- │
│ i64 ┆ i64 │
╞═════╪═════╡
│ 6   ┆ 2   │
│ 5   ┆ 3   │
│ 4   ┆ 4   │
│ 3   ┆ 5   │
│ 2   ┆ 6   │
│ 1   ┆ 7   │
└─────┴─────┘

关键优势说明

  • cs.integer() 自动识别所有有符号整数类型列(包括含 null 的 i64 列,如本例中的 'z'),无需关心具体位宽;
  • .exclude() 支持字符串、正则或 selector 多种形式,此处传入列名元组即可精准过滤;
  • 整个 select() 调用仅触发一次物理列提取,零冗余计算;
  • 可无缝组合其他 selector,例如 cs.integer() & ~cs.by_name("p", "z") 或 cs.integer().exclude(cs.starts_with("temp")),扩展性极强。

⚠️ 注意事项

  • cs.integer() 不包含无符号整数(如 u32, u64),如需涵盖,请改用 cs.by_dtype(pl.INTEGER_DTYPES);
  • 若目标列名不存在,.exclude() 不会报错,而是静默跳过(安全设计);
  • 该方法仅作用于列名匹配,不检查运行时数据内容(例如某 f64 列全为整数值也不会被选中)。

总之,善用 polars.selectors 是写出健壮、可维护 Polars 代码的关键实践之一。面对数百列的场景,这一模式不仅能显著减少代码量,更能将业务逻辑(“我要整数列,但不要 p 和 z”)直接映射为代码,大幅提升开发效率与可读性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

236

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

458

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1502

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

624

2023.11.24

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

1

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Rust 教程
Rust 教程

共28课时 | 5万人学习

Git 教程
Git 教程

共21课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号