0

0

如何将CSV中已处理的行移至新文件并从原文件删除

霞舞

霞舞

发布时间:2026-03-11 20:41:20

|

155人浏览过

|

来源于php中文网

原创

本文介绍一种安全、高效的csv数据分流方法:读取原始csv,将满足条件的行(如已处理数据)写入“used.csv”,其余行保留至新文件,最后用新文件覆盖原文件,实现自动归档与清理。

本文介绍一种安全、高效的csv数据分流方法:读取原始csv,将满足条件的行(如已处理数据)写入“used.csv”,其余行保留至新文件,最后用新文件覆盖原文件,实现自动归档与清理。

在实际数据处理流程中(如批量邮件发送、任务队列消费或ETL预处理),常需将“已使用”的记录从源CSV中隔离出来,既保留历史操作痕迹,又确保后续运行只处理未处理数据。CSV本身不支持原地行删除,因此推荐采用“读–分发–覆写”策略:一次性读取全部内容,按规则分流写入两个目标文件,再用保留未使用数据的新文件替换原始文件。该方法原子性强、逻辑清晰,且避免了逐行修改带来的IO开销与并发风险。

以下是完整实现示例(以部门为"Marketing"的行作为“已使用”数据为例):

What-the-Diff
What-the-Diff

检查请求差异,自动生成更改描述

下载
import csv
import shutil

# 定义路径
original_file = "data.csv"
used_file = "used.csv"
temp_file = "data_cleaned.csv"

# 步骤1:打开输入与两个输出文件(注意:必须指定 newline='' 防止空行)
with open(original_file, newline='') as f_in, \
     open(used_file, "w", newline='') as f_used, \
     open(temp_file, "w", newline='') as f_clean:

    reader = csv.reader(f_in)
    writer_used = csv.writer(f_used)
    writer_clean = csv.writer(f_clean)

    # 步骤2:读取并写入表头(如有)
    try:
        header = next(reader)
        writer_used.writerow(header)
        writer_clean.writerow(header)
    except StopIteration:
        # 空文件处理
        pass

    # 步骤3:逐行判断并分流写入
    for row in reader:
        # ✅ 自定义“已使用”条件:例如第2列(索引1)值为 "Marketing"
        if len(row) > 1 and row[1].strip() == "Marketing":
            writer_used.writerow(row)
        else:
            writer_clean.writerow(row)

# 步骤4:用 cleaned 文件安全覆盖原始文件(原子性替换)
shutil.move(temp_file, original_file)

print(f"✅ 已处理 {len([r for r in csv.reader(open(used_file))]) - (1 if open(used_file).readline().strip() else 0)} 行至 '{used_file}'")
print(f"✅ 原始文件 '{original_file}' 已更新为剩余未使用数据")

⚠️ 关键注意事项

  • 始终使用 newline='':这是Python csv 模块的强制要求,否则在Windows下可能产生多余空行;
  • 表头一致性:若原始CSV含表头,务必同步写入两个输出文件,否则后续读取易出错;
  • 条件判断健壮性:示例中增加了 len(row) > 1 和 .strip() 防御空列或空白字符干扰;
  • 原子性保障:通过 shutil.move() 替换原文件(而非直接写入),可避免程序中断导致原文件损坏;
  • 大文件优化提示:若CSV超10万行,建议改用 pandas 的 chunksize 流式处理,或借助数据库临时表。

此方案无需第三方库,兼容Python 3.6+,可轻松适配任意布尔条件(如时间戳早于当前日期、状态字段为"processed"等)。只需修改 if 判断逻辑,即可将“移动-删除”行为精准绑定到您的业务规则上,是构建可靠数据流水线的基础实践。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

78

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

32

2026.01.31

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

846

2023.08.22

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

846

2023.08.22

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1169

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

835

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

462

2023.08.02

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号