答案:使用pandas.read_excel()可轻松读取Excel文件,需注意文件路径、工作表选择、列名设置、数据类型及缺失值处理。

使用 Python 的 pandas 读取 Excel 文件非常简单,主要依赖 pandas.read_excel() 函数。下面介绍常用方法和注意事项,帮助你快速上手。
1. 基本读取操作
最简单的用法是直接传入文件路径:
import pandas as pd
df = pd.read_excel('data.xlsx')
这会默认读取第一个工作表(sheet),并将第一行作为列名。
2. 指定工作表
如果 Excel 文件包含多个 sheet,可以通过参数指定:
立即学习“Python免费学习笔记(深入)”;
EasySitePM Enterprise3.5系统是一款适用于不同类型企业使用的网站管理平于,它具有多语言、繁简从内核转换、SEO搜索优化、图片自定生成、用户自定界面、可视化订单管理系统、可视化邮件设置、模板管理、数据缓存+图片缓存+文件缓存三重提高访问速度、百万级数据快速读取测试、基于PHP+MYSQL系统开发,功能包括:产品管理、文章管理、订单处理、单页信息、会员管理、留言管理、论坛、模板管
- sheet_name='Sheet2':读取名为 "Sheet2" 的工作表
- sheet_name=0:读取第一个工作表(索引从0开始)
- sheet_name=['Sheet1', 'Sheet3']:读取多个工作表,返回字典
df = pd.read_excel('data.xlsx', sheet_name='Sales')
3. 自定义列名和跳过行
有时数据不是从第一行开始,或列名需要自定义:
- header=1:使用第2行为列名(跳过第一行)
- skiprows=2:跳过前两行
- usecols='A:C':只读取 A 到 C 列
- nrows=100:只读取前100行
df = pd.read_excel('data.xlsx', header=0, usecols='B:D', nrows=50)
4. 处理缺失值和数据类型
pandas 会自动识别空单元格为 NaN。你也可以在读取时进行处理:
- na_values=['NA', 'missing']:将特定字符串识别为缺失值
- dtype={'ID': str, 'age': int}:指定列的数据类型
df = pd.read_excel('data.xlsx', dtype={'phone': str}, na_values=['N/A'])
基本上就这些。只要安装了 openpyxl 或 xlrd(根据 Excel 格式),pandas 就能顺利读取 .xlsx 或 .xls 文件。不复杂但容易忽略的是确保文件路径正确,以及注意数据类型的自动转换问题。









