讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI聊天问答 Agent智能体 AI文本写作 AI绘画作图 AI设计工具 AI视频创作 AI音频制作 AI办公学习 AI编程开发 AI提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

pandas 如何在 read_csv 时强制某些列为 string 而非 int/float

冷漠man

发布时间：2026-01-23 18:26:02

|

945人浏览过

|

来源于php中文网

原创

最直接方法是用 dtype 参数指定列类型：dtype={"user_id": str} 或 dtype={0: str}；处理含空值的数字列时，必须同时设置 keep_default_na=False 和 na_values=None。

pandas 如何在 read_csv 时强制某些列为 string 而非 int/float

用 dtype 参数指定列类型最直接

read_csv 默认会尝试推断每列数据类型，遇到全数字就转成 int 或 float。要强制某列为 string，必须显式传入 dtype 参数，值为字典：键是列名（或列索引），值是 str 或 object（二者在此场景下等效）。

列名存在且稳定时，优先用列名：dtype={"user_id": str, "code": str}
列名可能缺失或含空格，可用列索引：dtype={0: str, 2: str}
若整张表都需保持原始字符串，直接用 dtype=str（但会关闭类型推断，所有列都变 object）
注意：如果该列后续有 na_values 或 keep_default_na=False 等设置，空值仍可能被识别为 NaN，此时列类型仍是 object，但元素混合了 str 和 float（NaN 是 float）——这不是你想要的，得配合 keep_default_na=False + na_values=None 控制

处理含缺失值的数字列转 string 的坑

这是最常踩的坑：一列看起来是“123”、“456”、“”，read_csv 默认把空转成 NaN，而 NaN 是浮点类型，导致即使你写了 dtype={"col": str}，最终该列仍是 object 类型，但内部混着 str 和 float（NaN），调用 .str.upper() 会报 AttributeError。

正确做法是关掉默认 NaN 解析：keep_default_na=False
同时清空自定义空值列表：na_values=None（否则 na_values=[""] 这类默认值仍生效）

完整示例：

pd.read_csv("data.csv", dtype={"id": str}, keep_default_na=False, na_values=None)

列名还没读出来时怎么指定 dtype？

有时 CSV 没有 header，或者 header 行本身含异常字符，你想跳过它再读，但又需要对特定位置的列设类型——这时不能靠列名，只能靠列序号。

用 header=None 让 pandas 不把第一行当列名，列自动命名为 0, 1, 2…
再用 dtype={1: str, 3: str} 指定第 2 列、第 4 列为 string
如果还用了 skiprows=1 跳过脏 header，注意 skiprows 在 header 解析前执行，列序号仍从实际读取的第一行开始计数

为什么不用 converters？

converters 看似灵活（例如 converters={"id": str}），但它是在 dtype 推断之后才执行的，属于“后处理”。这意味着：如果原列被识别为 int，而其中有非法值（如 "123abc"），read_csv 会先报错或转成 NaN，根本走不到 converters；而 dtype 是底层解析阶段控制，能避免类型冲突提前中断。

AIBox 一站式AI创作平台

AIBox 一站式AI创作平台

AIBox365一站式AI创作平台，支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

所以除非你需要做复杂转换（比如去空格+截取），否则别用 converters 强制 string——它不解决根本问题，还掩盖类型推断失败。

真正难的是混合空值和数字字符串的列，那几行配置组合（dtype + keep_default_na=False + na_values=None）缺一不可，少一个都可能让列里悄悄混进 NaN。

相关文章

如何将CSV中已处理的行安全迁移至新文件并从原文件移除

如何将CSV中已处理的行移至新文件并从原文件删除

如何将CSV中已处理的行移动到新文件并从原文件中移除

Python怎么写入CSV文件_csv.writer处理逗号分隔数据

Python CSV写入时出现空行的成因与解决方案

相关标签:

csv pandas 数据类型 String Float Object 字符串 int

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：fastapi 如何实现基于角色的权限控制（不使用依赖）下一篇：Python gc.get_referrers() 如何用来排查内存泄漏源头

作者最新文章

华为手机照片怎么传到另一个手机照片跨机传输步骤

2026-03-11 11:00

SQL日期时间字段优化_DATETIME与TIMESTAMP实践

2026-03-11 11:23

潜水员戴夫员工推荐图鉴潜水员戴夫全员推荐与攻略

2026-03-11 11:34

Linux服务启动失败排查_systemctl状态分析

2026-03-11 12:07

SQL备份恢复演练_全量增量备份流程

2026-03-11 12:08

Linux文件误删除恢复_ext4恢复思路

2026-03-11 12:55

SQL归档数据一致性保障_归档事务处理方案

2026-03-11 13:07

PHP 实现最小公共子串算法

2026-03-11 13:43

SQL分区表设计原则_时间分区与范围分区实践

2026-03-11 14:00

腾讯会议视频怎么录制

2026-03-11 14:52

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

更多

Python 时间序列分析与预测

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

81

2025.12.04

Python 数据清洗与预处理实战

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

33

2026.01.31

数据类型有哪几种

数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

338

2023.10.31

php数据类型

php数据类型

本专题整合了php数据类型相关内容，阅读专题下面的文章了解更多详细内容。

225

2025.10.31

c语言数据类型

c语言数据类型

本专题整合了c语言数据类型相关内容，阅读专题下面的文章了解更多详细内容。

138

2026.02.12

string转int

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

css中float用法

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

595

2024.04.28

C++中int、float和double的区别

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

108

2025.10.23

TypeScript类型系统进阶与大型前端项目实践

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

PHP自制框架

PHP自制框架

共8课时 | 0.6万人学习

PHP面向对象基础课程（更新中）

PHP面向对象基础课程（更新中）

共12课时 | 0.7万人学习

PHP8，究竟有啥野心..！？

PHP8，究竟有啥野心..！？

共4课时 | 0.6万人学习

最新文章

更多

Python高阶函数怎么用_map与filter函数式编程实战指南

Flask配置文件怎么写_config.py不同环境(Dev/Prod)配置类切换

Python怎么拦截通知_Windows系统底层弹窗通知系统级捕获与自动点击处理

Python怎么清理回收站_调用Windows API绕过确认提示彻底清空回收站垃圾文件

Python编码规范总结_代码可读性提升

Flask与Django哪个好_微框架与全栈框架特性对比与选型指南

Flask防止SQL注入_SQLAlchemy参数化绑定与安全查询规范

Python 类中调用同级方法时的 NameError 解决方案

高效计算单列与多列间皮尔逊相关系数的 NumPy 实现与精度陷阱解析

高效计算单列与多列间的皮尔逊相关系数（避免 pandas 和全矩阵计算）

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部