0

0

C#怎么解析CSV文件_C#如何高效读取表格数据【实战】

穿越時空

穿越時空

发布时间:2026-03-19 10:57:11

|

563人浏览过

|

来源于php中文网

原创

<p>TextFieldParser 是 C# 解析 CSV 最稳妥方案,需显式指定 UTF-8 编码、调用 SetDelimiters(",") 和设置 HasFieldsEnclosedInQuotes = true;大文件应改用 StreamReader + 状态机流式解析;避免 LINQ to CSV,推荐 CsvHelper(配 HeaderValidated 校验)或 DataTable;务必处理 BOM 与编码问题。</p>

c#怎么解析csv文件_c#如何高效读取表格数据【实战】

TextFieldParser 读 CSV 最稳,但别直接 new

它藏在 Microsoft.VisualBasic 命名空间里,C# 项目能用,而且专为 CSV/TSV 设计,自动处理带引号、换行、转义字段——比手撕 Split(',') 或硬套 StreamReader.ReadLine() 少踩 80% 的坑。

常见错误是直接 new TextFieldParser("file.csv"),结果中文路径乱码、BOM 头读错、空行崩掉。必须显式指定编码和配置:

  • TextFieldParser 默认用 Encoding.Default(通常是 GBK),UTF-8 文件得传 Encoding.UTF8
  • 务必调用 SetDelimiters(","),否则制表符也当分隔符
  • HasFieldsEnclosedInQuotes = true 打开才能正确解析 "John ""Doe"" Smith" 这种嵌套引号
using (var parser = new TextFieldParser("data.csv", Encoding.UTF8))
{
    parser.SetDelimiters(",");
    parser.HasFieldsEnclosedInQuotes = true;
    while (!parser.EndOfData)
    {
        string[] fields = parser.ReadFields(); // 这才是安全的逐行取数组
    }
}

大文件别加载进内存:用 StreamReader + 手写解析器

几 GB 的 CSV,TextFieldParser 会变慢(内部缓存+异常捕获开销大),DataTable.Load() 更是直接 OOM。这时候得自己流式拆行、按需解析字段。

关键不是“快”,而是“可控”:你能决定什么时候跳过某行、怎么转换数字、遇到脏数据是报错还是打日志。

  • StreamReader.ReadLine() 逐行读,别 File.ReadAllLines()
  • 字段分割不用 String.Split() —— 它无法识别引号包裹的逗号,改用状态机或正则(推荐 Microsoft.Data.SqlClient 里的轻量 CSV tokenizer,或用 System.Text.JsonJsonDocument.ParseValue(ref) 配合自定义 reader)
  • 数值字段用 double.TryParse() 而非 Convert.ToDouble(),避免脏数据炸掉整个批次

想用 LINQ 查数据?先选对库:别碰 LINQ to CSV

那个老库 LINQ to CSV 已多年不维护,不支持 .NET 6+,泛型映射常崩在空字段或类型推导上,错误信息是 NullReferenceException,根本看不出哪行哪列出问题。

替代方案就两个:

SkyReels
SkyReels

SkyReels是全球首个融合3D引擎与生成式AI的AI视频创作平台

下载
  • 小数据 + 强类型:用 System.Data.DataTable + SqlBulkCopy(如果最终要进 SQL Server)
  • 中小数据 + 灵活映射:用 Newtonsoft.JsonJsonConvert.DeserializeObject<List<T>>() 配合 CsvHelper(注意:用 CsvReader 构造时传 new CsvConfiguration(CultureInfo.InvariantCulture),否则数字小数点在某些区域设置下会解析失败)

示例中容易漏掉的是 CsvHelperHeaderValidated 事件——它能让你在第一行读完后立刻校验列名是否匹配预期,而不是等到第 10 万行才报 Missing field 'Email'

Encoding 和 BOM 是静默杀手,每次打开文件前都得看一眼

Windows 记事本存的 CSV 默认加 UTF-8 BOM(EF BB BF),而 TextFieldParser 和多数流读取器会把 BOM 当作首字段内容,导致第一列值开头多出乱码;Notepad++ 保存时选 “UTF-8 无 BOM” 才安全。

更隐蔽的是 ANSI 编码文件(其实是系统本地编码,比如中文 Win 是 GB2312)被当成 UTF-8 读——中文全变问号,但程序不报错,只是数据错得离谱。

  • File.ReadAllBytes() 检查前 3 字节是不是 0xEF, 0xBB, 0xBF 来确认有无 BOM
  • 不确定编码时,先试 Encoding.UTF8,失败再 fallback 到 Encoding.Default(但要知道这有平台依赖)
  • 生产环境建议统一要求上游提供 UTF-8 无 BOM 文件,并在代码里加断言:if (bytes[0] == 0xEF) throw new InvalidOperationException("BOM not allowed");

CSV 解析真正的复杂点不在语法,而在编码、区域格式、空值表示(NULL / "" / <empty>)、以及字段内真实换行符——这些细节不提前约定,后面补救成本远高于一开始加三行校验逻辑。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c#是什么意思
c#是什么意思

C#是一种通用的面向对象编程语言,它在.NET框架上运行,可用于开发各种类型的应用程序。本专题为大家提供c#相关的各种文章、以及下载和课程。

279

2023.08.08

什么是c#
什么是c#

C#(读作C Sharp)是一种现代的、通用的、面向对象的编程语言。它由微软公司开发,于2000年首次发布,主要用于开发Windows桌面应用程序、Web应用程序、移动应用程序以及游戏开发等领域。C#是一种类型安全和托管的编程语言,它结合了C++的强大性能和C语言的简单易学特点,并引入了许多新的特性和概念,如委托、属性、泛型和异步编程等,以提高开发效率和代码可维护性。

185

2023.08.31

C#中base关键字的用法
C#中base关键字的用法

在C#中,base关键字用于访问当前类的基类成员,这包括基类的字段、属性、方法、构造函数、索引器以及事件。想了解更多C#的相关内容,可以阅读本专题下面的文章。

327

2024.03.13

C#Task用法
C#Task用法

Task在C#中是用于表示异步操作的对象,它位于System.Threading.Tasks命名空间中。想了解更多C#中各种用法的相关内容,可以阅读本专题下面的文章。

380

2024.03.14

C# 并发与异步编程
C# 并发与异步编程

本专题系统讲解 C# 异步编程与并发控制,重点介绍 async 和 await 关键字、Task 类、线程池管理、并发数据结构、死锁与线程安全问题。通过多个实战项目,帮助学习者掌握 如何在 C# 中编写高效的异步代码,提升应用的并发性能与响应速度。

29

2026.02.03

C# 多线程与异步编程
C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧,包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目,帮助开发者掌握 如何在 C# 中构建高并发、低延迟的异步系统,提升应用性能和响应速度。

107

2026.02.06

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

416

2026.03.11

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1111

2023.08.02

bootstrap安装教程
bootstrap安装教程

本专题整合了bootstrap安装相关教程,阅读专题下面的文章了解更多详细操作教程。

22

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 11.6万人学习

C 教程
C 教程

共75课时 | 5.6万人学习

C++教程
C++教程

共115课时 | 22.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号