0

0

Python怎么读取CSV文件_csv模块reader与DictReader解析

P粉602998670

P粉602998670

发布时间:2026-03-18 09:22:03

|

602人浏览过

|

来源于php中文网

原创

csv.reader返回list,需用下标访问;DictReader才返回dict并以首行为键;务必用newline=''和合适encoding(如utf-8-sig防BOM),否则易出错。

python怎么读取csv文件_csv模块reader与dictreader解析

csv.reader 读出来是 list,不是 dict

csv.reader 读 CSV,每行返回的是一个 list,字段靠下标访问,比如 row[0] 是第一列。它不关心列名,哪怕第一行是表头,也照常当普通数据读——除非你手动跳过或提取。

常见错误现象:row['name']TypeError: list indices must be integers,就是误当字典用了。

  • 适合场景:列结构固定、字段少、不需要按名字取值(比如日志解析、批量数值处理)
  • 如果 CSV 有表头且你想用名字访问,别硬套 reader,换 DictReader
  • 注意编码:Windows 默认保存的 CSV 常是 gbkgb2312,用 open(..., encoding='utf-8') 会报 UnicodeDecodeError

csv.DictReader 自动把首行当字段名

DictReader 会把第一行当作 key,后续每行转成 dictrow['username'] 这样取值才自然。但它默认不跳过空行,也不自动 strip 字段两端空格。

使用场景:配置表、用户数据、需要按列名做逻辑分支的场合(比如只处理 'status' == 'active' 的行)。

立即学习Python免费学习笔记(深入)”;

MidReal AI
MidReal AI

MidReal AI是一款革命性的AI小说生成工具,同时也是一个文本互动冒险游戏平台。

下载
  • 字段名含空格或特殊字符?DictReader 照单全收,但之后写 row['user id'] 得带空格,容易漏——建议预处理 CSV 或用 fieldnames 参数重命名
  • 想跳过首行但首行不是表头?传 fieldnames=... 并设 restkey / restval 控制多余列行为
  • 性能影响:比 reader 略慢,因为要建 dict;内存占用略高,但对万行以内数据几乎无感

open() 必须用 newline='',否则 Windows 下多空行

这是 Python 官方文档明确要求的,但几乎所有新手第一次都踩坑。不用 newline='',在 Windows 上用 csv.readerDictReader 会把 CRLF 当两行,导致隔行出现空 list 或空 dict

错误现象:for row in reader: print(repr(row)) 输出一堆 []{}

  • 正确写法:with open('data.csv', newline='', encoding='utf-8') as f:
  • newline='' 不影响内容编码,和 encoding 各司其职,不能省也不能混用
  • Linux/macOS 下可能不明显,但代码跨平台时必须加

中文字段名 + 中文内容,DictReader 也可能乱码

即使文件是 UTF-8,如果用 Excel 保存过 CSV,它可能偷偷加了 BOM(\ufeff),导致 DictReader.fieldnames 第一个字段变成 '\ufeff姓名',后续 row['姓名'] 就 KeyError。

解决方法不是改 Excel 设置,而是代码里容错:

  • 打开时用 encoding='utf-8-sig',Python 会自动剥离 BOM
  • 或者手动检查:if fieldnames and fieldnames[0].startswith('\ufeff'): 再切片
  • 字段名含不可见字符?打印 repr(fieldnames) 比直接 print 更可靠
事情说清了就结束。BOM、newline、编码、字段名隐式污染——这些点不显眼,但组合起来能让 CSV 解析卡半天。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

848

2023.08.22

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

448

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

57

2025.09.03

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1562

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1172

2023.07.27

抖漫入口地址合集
抖漫入口地址合集

本专题整合了抖漫入口地址相关合集,阅读专题下面的文章了解更多详细地址。

17

2026.03.17

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号