
Python中用_csv模块读取CSV文件,本质是调用C语言实现的底层解析器,性能高、内存占用低,适合处理大文件或对效率有要求的场景。但注意:_csv是内部模块,不推荐直接导入使用;标准做法是导入csv模块——它正是对_csv的封装,接口稳定且功能完整。
用csv.reader读取普通CSV文件
适用于结构清晰、无复杂引号或换行符的CSV数据。
- 先用
open()以文本模式打开文件(Python 3默认utf-8,如有乱码需显式指定encoding) - 传入文件对象给
csv.reader(),返回一个可迭代对象 - 逐行遍历,每行是字符串列表,索引访问各字段
示例:
import csv
with open('data.csv', encoding='utf-8') as f:
reader = csv.reader(f)
for row in reader:
print(row) # 如 ['张三', '25', '北京']
用csv.DictReader按列名读取
当CSV首行为字段名(header)时更直观,自动将每行转为字典,键为列名,值为对应内容。
立即学习“Python免费学习笔记(深入)”;
- 无需手动处理表头,
DictReader默认把第一行当作字段名 - 可通过
fieldnames参数自定义列名,跳过原文件首行 - 支持
restkey和restval处理列数不一致的情况
示例:
import csv
with open('data.csv', encoding='utf-8') as f:
reader = csv.DictReader(f)
for row in reader:
print(row['name'], row['age']) # 如 '张三' '25'
处理特殊格式:分隔符、引号与编码
真实CSV常含制表符、中文逗号、带引号字段或GBK编码,需针对性配置。
-
delimiter:指定分隔符,如delimiter='\t'读TSV -
quotechar:指定引用符,默认'"',可改为"'"适配单引号包裹 -
skipinitialspace:设为True自动跳过分隔符后的空格 -
encoding:中文文件常用'gbk'或'utf-8-sig'(兼容BOM)
示例(读GBK编码、用分号分隔):
import csv
with open('data.csv', encoding='gbk') as f:
reader = csv.reader(f, delimiter=';', quotechar='"')
for row in reader:
print(row)
不建议直接导入_csv模块
_csv是CPython内部模块,无公开文档,接口可能随版本变动,且缺少高级功能(如DictReader、类型转换、错误提示等)。
- 直接
import _csv在PyPy、Jython等解释器中可能不可用 -
csv模块已足够高效,99%场景无需绕过它去调用底层 - 若真需极致性能(如GB级日志解析),应优先考虑
pandas.read_csv(底层也用C)或numpy.genfromtxt










