0

0

使用 Polars LazyFrame 进行列级乘法

心靈之曲

心靈之曲

发布时间:2025-11-19 15:37:02

|

734人浏览过

|

来源于php中文网

原创

使用 polars lazyframe 进行列级乘法

本文介绍了如何使用 Polars 库对两个 LazyFrame 进行列级别的乘法操作。由于直接对 LazyFrame 使用乘法运算符会引发 TypeError,本文提供了一种通过 join 操作和列选择来实现相同目的的有效方法,并附带示例代码。

在使用 Polars 处理大型数据集时,LazyFrame 提供了一种延迟计算的机制,可以显著提高性能。然而,直接对两个 LazyFrame 执行列级别的乘法操作会引发 TypeError。本文将介绍一种使用 join 操作来实现此目的的有效方法。

解决方案:使用 Join 和列选择

由于 Polars 的 LazyFrame 不直接支持 df1 * df2 这种列级别的乘法,我们需要采用一种替代方案。该方案的核心思想是:

  1. 为两个 LazyFrame 添加行索引。
  2. 使用行索引将两个 LazyFrame 连接起来。
  3. 选择连接后的 LazyFrame 中的列,并执行列级别的乘法操作。
  4. 收集结果,将 LazyFrame 转换为 DataFrame。

以下是具体的代码示例:

秘塔AI搜索
秘塔AI搜索

秘塔AI搜索,没有广告,直达结果

下载
import polars as pl
import numpy as np

# 示例数据
n = 10
df1 = pl.DataFrame(data={
    'foo': np.random.uniform(0,127, size= n).astype(np.float64),
    'bar': np.random.uniform(1e3,32767, size= n).astype(np.float64),
    'baz': np.random.uniform(1e6,2147483, size= n).astype(np.float64)
}).lazy()

df2 = pl.DataFrame(data={
    'foo': np.random.uniform(0,127, size= n).astype(np.float64),
    'bar': np.random.uniform(1e3,32767, size= n).astype(np.float64),
    'baz': np.random.uniform(1e6,2147483, size= n).astype(np.float64)
}).lazy()


result = (
    df1.with_row_index()
    .join(df2.with_row_index(), on="index")
    .select(pl.col(col) * pl.col(f"{col}_right") for col in df1.columns)
    .collect()
)

print(result)

代码解释:

  • df1.with_row_index(): 为 df1 添加一个名为 "index" 的列,作为行索引。
  • df2.with_row_index(): 为 df2 添加一个名为 "index" 的列,作为行索引。
  • .join(df2.with_row_index(), on="index"): 使用 "index" 列将 df1 和 df2 连接起来。连接后的 LazyFrame 将包含 df1 的所有列,以及 df2 的所有列,其中 df2 的列名会加上 "_right" 后缀。
  • .select(pl.col(col) * pl.col(f"{col}_right") for col in df1.columns): 选择连接后的 LazyFrame 中的列,并执行列级别的乘法操作。对于 df1 中的每一列 col,我们将其与 df2 中对应的列 col_right 相乘。
  • .collect(): 将 LazyFrame 转换为 DataFrame,并执行计算。

注意事项:

  • 此方法依赖于两个 LazyFrame 具有相同的行数和顺序。
  • 如果两个 LazyFrame 的列名不同,需要相应地调整 select 语句中的列名。
  • 此方法适用于列级别运算,不仅仅是乘法,可以替换为加法、减法、除法等其他运算。

总结:

虽然 Polars 的 LazyFrame 不直接支持列级别的乘法操作,但我们可以通过 join 操作和列选择来实现相同的目的。这种方法不仅有效,而且可以充分利用 LazyFrame 的延迟计算特性,提高性能。 通过为 LazyFrame 添加索引,进行 join 操作,并使用 select 方法进行列级运算,可以有效地解决 LazyFrame 无法直接进行列级乘法的问题。这种方法保持了 LazyFrame 的延迟计算优势,适用于处理大型数据集。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1491

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

230

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

86

2025.10.17

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

9

2026.01.23

php远程文件教程合集
php远程文件教程合集

本专题整合了php远程文件相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.22

PHP后端开发相关内容汇总
PHP后端开发相关内容汇总

本专题整合了PHP后端开发相关内容,阅读专题下面的文章了解更多详细内容。

18

2026.01.22

php会话教程合集
php会话教程合集

本专题整合了php会话教程相关合集,阅读专题下面的文章了解更多详细内容。

19

2026.01.22

宝塔PHP8.4相关教程汇总
宝塔PHP8.4相关教程汇总

本专题整合了宝塔PHP8.4相关教程,阅读专题下面的文章了解更多详细内容。

10

2026.01.22

PHP特殊符号教程合集
PHP特殊符号教程合集

本专题整合了PHP特殊符号相关处理方法,阅读专题下面的文章了解更多详细内容。

11

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号