0

0

c++读取csv文件方法 c++如何实现解析csv文件

畫卷琴夢

畫卷琴夢

发布时间:2026-03-18 22:30:01

|

680人浏览过

|

来源于php中文网

原创

必须用std::getline按行读再手动拆字段,因operator>>会误切逗号、引号和换行;需处理BOM、\r\n、引号包裹及双引号转义,推荐状态机解析,避免正则与第三方库。

c++读取csv文件方法 c++如何实现解析csv文件

fstream 逐行读取 CSV,别直接用 operator>>

CSV 不是结构化二进制格式,operator>> 会把逗号、引号、换行全当分隔符乱切,尤其字段含空格或逗号时直接崩。必须用 std::getline 按行读,再手动拆字段。

  • 先用 std::getline(in, line) 读整行,避免跳过空白或截断
  • 字段分隔符不一定是逗号——可能是 ;\t,得提前确认,别硬编码 ','
  • 遇到带双引号的字段(如 "Smith, John"),不能用 std::stringstream + getline(ss, field, ',') 简单切,会把引号内逗号也当分隔符
  • Windows 换行是 \r\n,Linux 是 \nstd::getline 默认按 \n 切,但文件若含 \r(尤其 Excel 导出),记得在解析前用 line.erase(std::remove(line.begin(), line.end(), '\r'), line.end())

处理带引号和转义的字段,手写状态机比正则更稳

标准 CSV 规范(RFC 4180)允许字段用双引号包裹,且引号内可用两个双引号表示一个字面引号(如 "He said ""Hi"".")。正则在 C++ 里难写又难调试,不如用几十行状态机。

  • 状态分三种:OUTSIDE(普通字符)、INSIDE(引号内)、ESCAPED(刚读到第一个引号)
  • 遇到 ":若当前是 OUTSIDE → 进 INSIDE;若已在 INSIDE 且下一个是 " → 当前为 ESCAPED,跳过下一个 "
  • std::string::find_first_of(",\n\r") 在引号外才有效,引号内一律忽略
  • 别依赖第三方库(如 csv-parser)就为了省这几十行——它可能不支持 BOM、不处理 \r\n、或把空字段解析成空字符串而非 nullptr

中文路径或 UTF-8 内容读取失败?先关掉 std::ios::sync_with_stdio

Windows 下用 std::ifstream 读含中文路径的文件,或内容含 UTF-8 字符(如中文列名),常卡在打开失败或乱码。根本原因是 C++ 标准流默认绑定 C stdio,而 Windows 的 fopen 对宽路径支持差。

  • 显式用 std::wifstream + std::locale 配合 std::codecvt_utf8<wchar_t></wchar_t>(C++17 前);C++17 起推荐用 std::filesystem::path 构造路径,再转 std::string(需确保源文件是 UTF-8)
  • Linux/macOS 下通常没问题,但若 CSV 由 Excel 导出,可能带 BOM(0xEF 0xBB 0xBF),读第一行前要检查并跳过
  • 禁用同步:std::ios::sync_with_stdio(false) 能提速,但会导致 printf/scanfstd::cin/std::cout 混用时输出错乱,纯文件读取可开,混用日志就关

内存和性能:大文件别一次性 std::vector<:vector>></:vector>

10 万行 × 50 列的 CSV,每个字段平均 20 字节,光字符串对象就占几百 MB。堆分配频繁还会触发多次 realloc,卡顿明显。

百灵大模型
百灵大模型

蚂蚁集团自研的多模态AI大模型系列

下载

立即学习C++免费学习笔记(深入)”;

  • 按行处理:读一行 → 解析 → 处理逻辑 → 清空临时容器,别存全量
  • 字段复用:用 std::string_view(C++17)代替 std::string 存字段,只记起止位置,避免拷贝
  • 预分配缓冲区:std::string line; line.reserve(4096); 减少反复扩容
  • 若真要缓存全部数据,改用 std::deque 或自定义池分配器,std::vector 在中间插入/删除低效,但 CSV 是顺序读,其实够用

最麻烦的永远不是怎么读,而是 CSV 根本没标准——Excel 导出加 BOM、字段漏引号、末尾多逗号、换行嵌在引号里……写完解析逻辑后,一定拿真实数据跑三遍:空字段、含逗号字段、含换行字段。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1091

2023.08.02

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

309

2023.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

781

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1571

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

652

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1269

2024.03.22

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

7

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 11.6万人学习

C 教程
C 教程

共75课时 | 5.6万人学习

C++教程
C++教程

共115课时 | 22.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号