如何正确将动态追加的数据保存到 CSV 文件中

花韻仙語

发布时间：2026-02-15 10:45:01

159人浏览过

来源于php中文网

原创

如何正确将动态追加的数据保存到 CSV 文件中

本文详解为何在 Pandas 中修改源字典后 DataFrame 未同步更新，导致 to_csv() 输出空文件，并提供标准解决方案：每次保存前重新构建 DataFrame 或直接更新 DataFrame。

本文详解为何在 pandas 中修改源字典后 dataframe 未同步更新，导致 `to_csv()` 输出空文件，并提供标准解决方案：每次保存前重新构建 dataframe 或直接更新 dataframe。

在使用 Pandas 构建数据采集脚本时，一个常见误区是：将字典作为数据容器持续 append()，却在初始化后不再更新其对应的 DataFrame。如以下典型代码：

import pandas as pd

l1 = {"name": [], "order no": [], "price": []}
df = pd.DataFrame(l1)  # ← 此处仅一次性创建空 DataFrame
while True:
    exit_cmd = input("enter exit to exit: ")
    name = input("enter your name: ")
    order_no = int(input("enter your order no: "))
    price = int(input("enter your price: "))
    printing = input("type print to print data: ")

    if exit_cmd == "exit" or printing == "print":
        df.to_csv("output.csv", index=False)  # ← 仍为初始空 DataFrame！
        break
    else:
        l1["name"].append(name)
        l1["order no"].append(order_no)
        l1["price"].append(price)
        print(l1)

运行后，output.csv 始终为空（仅含表头），因为 df 在循环外创建后就再未刷新——它与字典 l1 无引用关联。Pandas DataFrame 是独立对象，不会自动响应底层列表的变更。

Lemonaid

AI音乐生成工具，在音乐领域掀起人工智能革命

下载

✅ 正确做法一：保存前重建 DataFrame（推荐初学者）
将 df = pd.DataFrame(l1) 移至写入前，确保 DataFrame 反映最新数据：

if exit_cmd == "exit" or printing == "print":
    df = pd.DataFrame(l1)  # ✅ 每次保存前重新构造
    df.to_csv("output.csv", index=False)
    print("Data saved to output.csv")
    break

✅ 正确做法二：直接操作 DataFrame（更高效、更 Pandas 风格）
避免中间字典，用 pd.concat() 或 df.loc[len(df)] 追加行（注意：loc 追加在小数据量下简洁，大数据量建议累积后批量写入）：

df = pd.DataFrame(columns=["name", "order no", "price"])  # 初始化空表
# …… 循环内获取输入后：
new_row = pd.DataFrame([{"name": name, "order no": order_no, "price": price}])
df = pd.concat([df, new_row], ignore_index=True)  # ✅ 动态扩展 DataFrame

# 保存时：
if exit_cmd == "exit" or printing == "print":
    df.to_csv("output.csv", index=False)
    break

⚠️ 注意事项：

不要混用“字典追加 + 静态 DataFrame”，这是本问题的根本原因；
pd.concat() 默认返回新 DataFrame，需显式赋值（df = pd.concat(...)）；
若数据量极大（>10,000 行），避免在循环中频繁 concat，应先收集所有数据再一次性构建 DataFrame；
建议添加 index=False 参数防止 CSV 多出索引列；
生产环境建议加入异常处理（如 try/except 捕获 int() 转换错误）。

总结：Pandas DataFrame 并非字典的“实时视图”，而是其创建时刻的一份快照。要确保 CSV 输出准确，必须保证 to_csv() 调用的对象已包含最新数据——要么重建 DataFrame，要么直接维护 DataFrame 本身。

如何高效分割并处理超大CSV文件以实现分块排序

如何高效分块处理并排序超大CSV文件（Python教程）

如何从CSV列字符串中精准提取日期并过滤最大日期行

如何从CSV列字符串中精准提取日期并筛选非最大日期记录

将 Pandas DataFrame 中的时间戳列正确写入 BigQuery

相关标签:

csv pandas try int 循环 len append 对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 多环境配置的管理实践下一篇：暂无

作者最新文章

html5中新增标签的兼容性如何设置

2026-02-13 17:23

如何将html编辑器设置为记事本

2026-02-13 17:33

如何用html做一个3D地球仪

2026-02-13 17:34

Go语言AST中Doc与Comment的区别详解

2026-02-13 17:37

Laravel 中基于模型类型的条件关联关系实现指南

2026-02-13 17:39

如何在 Java 中安全获取集合视图（View）的第一个和最后一个元素

2026-02-13 17:41

vs如何在浏览器中打开html文件夹下

2026-02-13 17:42

如何处理html5新标签的兼容性

2026-02-13 17:43

如何做一个课程表的HTML表单

2026-02-13 17:45

html的注册页面如何跳转页面代码怎么写

2026-02-13 17:45

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

730

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

564

2024.08.29