如何在含缺失值的多列日期中按组筛选最大有效日期

花韻仙語

发布时间：2026-02-03 13:21:10

492人浏览过

来源于php中文网

原创

如何在含缺失值的多列日期中按组筛选最大有效日期

本文介绍如何在 pandas 中对含 nan 的多个日期列（如 `cop_date`、`fat_date`）进行条件过滤与分组聚合，确保每组内各日期列值均不小于基准列 `date`，并统一填充为该组内满足条件的最小有效日期。

在实际数据分析中，常需校验业务逻辑约束：例如某订单的确认日期（cop_date）和失效日期（fat_date）必须晚于主日期（date）。当原始数据存在缺失值（NaN）或违反约束的异常值时，直接取最大值会出错。此时需结合条件筛选、分组聚合与缺失值处理，实现稳健的日期对齐。

✅ 正确处理流程

统一转为 datetime 类型
首先将所有日期列转换为 datetime64[ns]，便于后续比较与计算：

dates = ['date', 'cop_date', 'fat_date']
df[dates] = df[dates].apply(lambda x: pd.to_datetime(x, format='%d/%m/%Y'))

⚠️ 注意：若日期格式不统一（如混用 YYYY-MM-DD 和 DD/MM/YYYY），建议使用 format=None 让 pd.to_datetime() 自动推断，或先清洗再转换。

构建逻辑掩码，标记合规值
判断 cop_date 不合规的异常值，应置为 NaT（Pandas 中日期类型的缺失值）：

m1 = df['cop_date'] < df['date']  # True 表示 cop_date 过早，需剔除
m2 = df['fat_date'] < df['date']  # 同理

按业务键分组，填充合规最小日期
使用 .where() 保留合规值（m1/m2 为 False 的位置），再通过 groupby(...).transform('min') 实现：
- 每组内仅保留满足 cop_date >= date 的日期；
- 若该组无合规值，则结果为 NaT（即保持缺失）；
- 最终将该组最小合规日期广播至所有行。

cols = ['id', 'ins_id']  # 分组依据（如订单ID + 保险子项）
df[['cop_date', 'fat_date']] = (
    df.assign(
        cop_date=df['cop_date'].where(~m1),   # ~m1 → 保留 cop_date >= date 的值
        fat_date=df['fat_date'].where(~m2)
    )
    .groupby(cols)[['cop_date', 'fat_date']]
    .transform('min')
)

? 关键点：~m1 是逻辑取反，表示“cop_date 不小于 date”，即合规；.where(~m1) 将不合规位置设为 NaT，再由 transform('min') 在组内求最小非空日期。

速创猫AI简历
一键生成高质量简历

下载

可选：还原为原始字符串格式
如需输出为 DD/MM/YYYY 字符串：

df[dates] = df[dates].apply(lambda x: x.dt.strftime('%d/%m/%Y'))

? 总结与建议

本方法避免了 max() 直接作用于含 NaN 的 Series 导致的错误传播，也规避了 fillna() 的盲目补全；
transform('min') 确保组内一致性，适用于报表生成、规则校验等场景；
若需取最大合规日期而非最小，仅需将 'min' 替换为 'max'；
对超大数据集，可考虑用 pd.NaT 替代 np.nan 显式声明日期缺失，提升性能与类型安全。

最终结果中，每组 cop_date 和 fat_date 均被修正为该组内满足 >= date 约束的最小有效日期（若无可合规值则保持 NaN），逻辑清晰且可复现。

限制 Tkinter Entry 输入为两位数字：字符长度与数值类型双重校验

Python 中字典赋值与引用的深层机制：为什么修改同一对象会影响所有引用？

Python 中字典赋值与引用的深层机制：为什么修改一个字典会影响另一个？

python序列化数据_选择合适格式保存字典、列表、对象实例方案

python序列化的原理和作用_数据存储、传输与状态保存机制详解

相关标签:

大数据 app yy pandas date format 字符串 transform 数据分析

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Z3 是否支持三值逻辑判断（True/False/Unknown）？下一篇：暂无

作者最新文章

如何在 Qdrant 中安全地向已有图像集合追加新数据（而非覆盖重建）

2026-02-01 16:26

JavaScript 多条件动态过滤：实现国家与作物的独立/组合筛选

2026-02-01 16:27

如何在 Go 中获取 Windows 系统已安装服务列表

2026-02-01 16:29

Vaadin 23.3.5 路由 404 问题的根源与修复方案

2026-02-01 16:36

JavaScript 中模板字符串插值会强制转换为字符串类型的原因详解

2026-02-01 16:42

Go Web 开发中使用 entr 实时重启服务时端口被占用的解决方案

2026-02-01 16:50

如何使用数字输入框动态构建订单商品数组

2026-02-01 16:52

如何在 Matplotlib 中实现单图实时更新而非重复创建新窗口

2026-02-01 17:17

Python 属性命名中下划线前缀的正确用法与设计意图

2026-02-01 17:31

如何将一维用户数组结构化为嵌套的多维配置数组

2026-02-01 17:43

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

844

2023.07.31

python中的format是什么意思

python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

439

2024.06.27

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

361

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

213

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1505

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

626

2023.11.24

c语言中/相关合集

本专题整合了c语言中/的用法、含义解释。阅读专题下面的文章了解更多详细内容。

2026.02.03

热门下载

网站特效

网站源码

网站素材

前端模板