C#怎么解析CSV文件_C#如何高效读取表格数据【实战】

穿越時空

发布时间：2026-03-19 10:57:11

563人浏览过

来源于php中文网

原创

<p>TextFieldParser 是 C# 解析 CSV 最稳妥方案，需显式指定 UTF-8 编码、调用 SetDelimiters(",") 和设置 HasFieldsEnclosedInQuotes = true；大文件应改用 StreamReader + 状态机流式解析；避免 LINQ to CSV，推荐 CsvHelper（配 HeaderValidated 校验）或 DataTable；务必处理 BOM 与编码问题。</p>

c#怎么解析csv文件_c#如何高效读取表格数据【实战】

用 `TextFieldParser` 读 CSV 最稳，但别直接 new

它藏在 Microsoft.VisualBasic 命名空间里，C# 项目能用，而且专为 CSV/TSV 设计，自动处理带引号、换行、转义字段——比手撕 Split(',') 或硬套 StreamReader.ReadLine() 少踩 80% 的坑。

常见错误是直接 new TextFieldParser("file.csv")，结果中文路径乱码、BOM 头读错、空行崩掉。必须显式指定编码和配置：

TextFieldParser 默认用 Encoding.Default（通常是 GBK），UTF-8 文件得传 Encoding.UTF8
务必调用 SetDelimiters(",")，否则制表符也当分隔符
HasFieldsEnclosedInQuotes = true 打开才能正确解析 "John ""Doe"" Smith" 这种嵌套引号

using (var parser = new TextFieldParser("data.csv", Encoding.UTF8))
{
    parser.SetDelimiters(",");
    parser.HasFieldsEnclosedInQuotes = true;
    while (!parser.EndOfData)
    {
        string[] fields = parser.ReadFields(); // 这才是安全的逐行取数组
    }
}

大文件别加载进内存：用 `StreamReader` + 手写解析器

几 GB 的 CSV，TextFieldParser 会变慢（内部缓存+异常捕获开销大），DataTable.Load() 更是直接 OOM。这时候得自己流式拆行、按需解析字段。

关键不是“快”，而是“可控”：你能决定什么时候跳过某行、怎么转换数字、遇到脏数据是报错还是打日志。

用 StreamReader.ReadLine() 逐行读，别 File.ReadAllLines()
字段分割不用 String.Split() —— 它无法识别引号包裹的逗号，改用状态机或正则（推荐 Microsoft.Data.SqlClient 里的轻量 CSV tokenizer，或用 System.Text.Json 的 JsonDocument.ParseValue(ref) 配合自定义 reader）
数值字段用 double.TryParse() 而非 Convert.ToDouble()，避免脏数据炸掉整个批次

想用 LINQ 查数据？先选对库：别碰 `LINQ to CSV`

那个老库 LINQ to CSV 已多年不维护，不支持 .NET 6+，泛型映射常崩在空字段或类型推导上，错误信息是 NullReferenceException，根本看不出哪行哪列出问题。

替代方案就两个：

SkyReels

SkyReels是全球首个融合3D引擎与生成式AI的AI视频创作平台

下载

小数据 + 强类型：用 System.Data.DataTable + SqlBulkCopy（如果最终要进 SQL Server）
中小数据 + 灵活映射：用 Newtonsoft.Json 的 JsonConvert.DeserializeObject<List<T>>() 配合 CsvHelper（注意：用 CsvReader 构造时传 new CsvConfiguration(CultureInfo.InvariantCulture)，否则数字小数点在某些区域设置下会解析失败）

示例中容易漏掉的是 CsvHelper 的 HeaderValidated 事件——它能让你在第一行读完后立刻校验列名是否匹配预期，而不是等到第 10 万行才报 Missing field 'Email'。

`Encoding` 和 BOM 是静默杀手，每次打开文件前都得看一眼

Windows 记事本存的 CSV 默认加 UTF-8 BOM（EF BB BF），而 TextFieldParser 和多数流读取器会把 BOM 当作首字段内容，导致第一列值开头多出乱码；Notepad++ 保存时选 “UTF-8 无 BOM” 才安全。

更隐蔽的是 ANSI 编码文件（其实是系统本地编码，比如中文 Win 是 GB2312）被当成 UTF-8 读——中文全变问号，但程序不报错，只是数据错得离谱。

用 File.ReadAllBytes() 检查前 3 字节是不是 0xEF, 0xBB, 0xBF 来确认有无 BOM
不确定编码时，先试 Encoding.UTF8，失败再 fallback 到 Encoding.Default（但要知道这有平台依赖）
生产环境建议统一要求上游提供 UTF-8 无 BOM 文件，并在代码里加断言：if (bytes[0] == 0xEF) throw new InvalidOperationException("BOM not allowed");

CSV 解析真正的复杂点不在语法，而在编码、区域格式、空值表示（NULL / "" / <empty>）、以及字段内真实换行符——这些细节不提前约定，后面补救成本远高于一开始加三行校验逻辑。

C#怎么判断路径是否合法_C#如何校验文件名中的非法字符【示例】

C#怎么防止重复打开软件_C#如何使用Mutex互斥锁【避坑】

C#怎么判断枚举是否包含指定值_C#如何操作枚举类型【技巧】

C#怎么获取某个进程的CPU占用率_C#如何监控特定程序性能【技巧】

C#怎么获取当前线程的ID_C#如何分析多线程执行状态【笔记】

相关标签:

c# c# String Array Regex FileStream

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C#获取NTFS压缩文件属性 C#如何判断或设置文件/文件夹的压缩状态下一篇：C#怎么让窗体居中显示_C#如何设置窗口启动位置【代码】

作者最新文章

C#怎么实现DataGridView分页_C#如何展示海量数据【指南】

2026-03-19 10:09

Composer怎么配合Xdebug调试_Composer如何在Xdebug开启时处理Composer运行变慢的问题【避坑】

2026-03-19 10:23

iCloud同步失败怎么办解决iCloud数据不同步问题【方案】

2026-03-19 10:38

Composer怎么配置HTTP Basic认证_Composer如何在auth.json中保存用户名和密码【操作】

2026-03-19 10:44

360浏览器官方网站入口 360浏览器在线网页版

2026-03-19 10:46

WorkBuddy如何远程操作电脑里的ERP系统_WorkBuddy指令控制业务软件教程【全解】

2026-03-19 10:50

Composer怎么升级Laravel框架版本_Composer如何按官方升级指南更新Laravel到新版本【教程】

2026-03-19 10:51

C#怎么解析CSV文件_C#如何高效读取表格数据【实战】

2026-03-19 10:57

C#怎么实现泛型约束_C#如何限定泛型必须是类或接口【教程】

2026-03-19 11:08

电脑开机黑屏怎么办电脑故障排查及简单修复方法【指南】

2026-03-19 11:09

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c#是什么意思

C#是一种通用的面向对象编程语言，它在.NET框架上运行，可用于开发各种类型的应用程序。本专题为大家提供c#相关的各种文章、以及下载和课程。

279

2023.08.08

什么是c#

C#（读作C Sharp）是一种现代的、通用的、面向对象的编程语言。它由微软公司开发，于2000年首次发布，主要用于开发Windows桌面应用程序、Web应用程序、移动应用程序以及游戏开发等领域。C#是一种类型安全和托管的编程语言，它结合了C++的强大性能和C语言的简单易学特点，并引入了许多新的特性和概念，如委托、属性、泛型和异步编程等，以提高开发效率和代码可维护性。

185

2023.08.31

C#中base关键字的用法

在C#中，base关键字用于访问当前类的基类成员，这包括基类的字段、属性、方法、构造函数、索引器以及事件。想了解更多C#的相关内容，可以阅读本专题下面的文章。

327

2024.03.13

C#Task用法

Task在C#中是用于表示异步操作的对象，它位于System.Threading.Tasks命名空间中。想了解更多C#中各种用法的相关内容，可以阅读本专题下面的文章。

380

2024.03.14

C# 并发与异步编程

本专题系统讲解 C# 异步编程与并发控制，重点介绍 async 和 await 关键字、Task 类、线程池管理、并发数据结构、死锁与线程安全问题。通过多个实战项目，帮助学习者掌握如何在 C# 中编写高效的异步代码，提升应用的并发性能与响应速度。

2026.02.03

C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧，包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目，帮助开发者掌握如何在 C# 中构建高并发、低延迟的异步系统，提升应用性能和响应速度。

107

2026.02.06

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

416

2026.03.11