0

0

如何将CSV中已处理的行移动到新文件并从原文件中移除

聖光之護

聖光之護

发布时间:2026-03-11 20:38:06

|

645人浏览过

|

来源于php中文网

原创

如何将CSV中已处理的行移动到新文件并从原文件中移除

本文介绍一种安全、高效的方法,通过读取原始csv、条件分流写入两个新文件(“已用”与“未用”),再用“未用”文件覆盖原文件,实现数据行的精准迁移与清理。

本文介绍一种安全、高效的方法,通过读取原始csv、条件分流写入两个新文件(“已用”与“未用”),再用“未用”文件覆盖原文件,实现数据行的精准迁移与清理。

在实际数据处理流程中(如批量邮件发送、任务队列消费、ETL抽取等),常需将已处理的记录从源CSV中“移出”,既保留操作痕迹(存入 used.csv),又确保后续运行只处理剩余数据。CSV本身不支持原地删除行,因此必须采用“读–分–写–替换”的策略:一次性读取全部内容,按业务逻辑分流写入两个独立文件,最后用“未用数据”文件安全覆盖原始文件。

以下是一个完整、健壮的实现示例。假设我们希望将所有 Department == "Marketing" 的员工记录移至 used.csv,其余保留在更新后的 data.csv 中:

maven使用方法 中文WORD版
maven使用方法 中文WORD版

本文档主要讲述的是maven使用方法;Maven是基于项目对象模型的(pom),可以通过一小段描述信息来管理项目的构建,报告和文档的软件项目管理工具。Maven将你的注意力从昨夜基层转移到项目管理层。Maven项目已经能够知道 如何构建和捆绑代码,运行测试,生成文档并宿主项目网页。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
import csv
import shutil

# 定义路径
input_file = "data.csv"
used_file = "used.csv"
temp_file = "data_temp.csv"  # 避免直接覆盖时出错

# 步骤1:打开输入与两个输出文件(注意:必须指定 newline='')
with open(input_file, newline='') as f_in, \
     open(used_file, "w", newline='') as f_used, \
     open(temp_file, "w", newline='') as f_temp:

    reader = csv.reader(f_in)
    writer_used = csv.writer(f_used)
    writer_temp = csv.writer(f_temp)

    # 步骤2:读取并写入表头(如有)
    try:
        header = next(reader)
        writer_used.writerow(header)
        writer_temp.writerow(header)
    except StopIteration:
        # 空文件,直接退出
        pass

    # 步骤3:逐行判断并分流写入
    for row in reader:
        if len(row) > 1 and row[1].strip() == "Marketing":  # 防止索引越界 + 去空格
            writer_used.writerow(row)
        else:
            writer_temp.writerow(row)

# 步骤4:原子化替换原文件(关键!)
shutil.move(temp_file, input_file)

print(f"✅ 已成功将 {sum(1 for _ in open(used_file))) - (1 if sum(1 for _ in open(used_file)) > 0 else 0)} 条 Marketing 记录移入 '{used_file}'")
print(f"✅ 原始文件 '{input_file}' 已更新为剩余数据。")

关键注意事项

  • 永远使用 newline='':避免在 Windows 下产生多余空行(Python CSV 模块强制要求);
  • 优先使用 with 语句管理文件:确保异常时自动关闭,提升健壮性(原答案中“无需手动关闭”仅适用于极简脚本,生产环境务必显式管理);
  • 表头处理要安全:用 try/except 处理无表头或空文件场景;
  • 字段校验不可少:访问 row[1] 前检查长度,避免 IndexError;
  • 替换务必原子化:先写入临时文件,再 shutil.move() 替换,防止中断导致原文件损坏;
  • 如需增量处理(每次只移1行):可封装为函数,配合外部循环调用,并在每次移动后重新加载 data.csv。

该方法不依赖第三方库,兼容 Python 3.6+,逻辑清晰、可审计性强——每条被移走的数据都明确留存于 used.csv,原始文件始终保持有效状态,是自动化数据流水线中的推荐实践。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1169

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

835

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

462

2023.08.02

windows无法访问共享电脑
windows无法访问共享电脑

在现代社会中,共享电脑是办公室和家庭的重要组成部分。然而,有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享,影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

2361

2023.08.08

windows自动更新
windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新,以提高系统的稳定性和安全性。然而,有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

874

2023.08.10

windows boot manager
windows boot manager

windows boot manager无法开机的解决方法:1、系统文件损坏,使用Windows安装光盘或USB启动盘进入恢复环境,选择修复计算机,然后选择自动修复;2、引导顺序错误,进入恢复环境,选择命令提示符,输入命令"bootrec /fixboot"和"bootrec /fixmbr",然后重新启动计算机;3、硬件问题,使用硬盘检测工具进行扫描和修复;4、重装操作系统。本专题还提供其他解决

1974

2023.08.28

windows锁屏快捷键
windows锁屏快捷键

windows锁屏快捷键是Windows键+L、Ctrl+Alt+Del、Windows键+D、Windows键+P和Windows键+R。本专题为大家提供windows相关的文章、下载、课程内容,供大家免费下载体验。

1670

2023.08.30

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号