C# 操作JSONL/NDJSON文件 C#如何读取和写入换行分隔的JSON文件

幻夢星雲

发布时间：2026-02-19 10:24:34

412人浏览过

来源于php中文网

原创

用 streamreader 逐行读取 jsonl 文件最稳，因其每行是独立 json 对象，须逐行解析而非整体反序列化；写入时禁用 writeindented 并用 writeline 确保单行格式；处理大文件需异步读取并显式设置缓冲区与编码以规避 bom 和超长行问题。

c# 操作jsonl/ndjson文件 c#如何读取和写入换行分隔的json文件

用 `StreamReader` 逐行读取 JSONL 文件最稳

JSONL（也叫 NDJSON）本质就是每行一个合法 JSON 对象，不能当完整 JSON 数组去解析。直接用 JsonSerializer.Deserialize<list>>()</list> 会报 JsonException: The input does not contain any JSON tokens 或中途崩溃——因为第一行之后的换行符会让反序列化器误判流已结束。

正确做法是按行读，每行单独解析：

用 StreamReader 打开文件，调用 ReadLine() 逐行获取字符串
对每一行非空字符串，传给 JsonSerializer.Deserialize<t>()</t>，别用 DeserializeAsync ——它不适用于碎片化输入
遇到某行解析失败（比如字段缺失、类型错），建议记录该行号和原始内容，而不是直接抛异常中断整个读取

示例关键片段：

using var reader = new StreamReader("data.jsonl");
string? line;
int lineNumber = 0;
while ((line = await reader.ReadLineAsync()) != null)
{
    lineNumber++;
    if (string.IsNullOrWhiteSpace(line)) continue;
    try
    {
        var item = JsonSerializer.Deserialize<MyRecord>(line);
        // 处理 item
    }
    catch (JsonException ex)
    {
        Console.WriteLine($"Line {lineNumber} parse failed: {ex.Message}");
    }
}

写入 JSONL 必须手动控制换行，不能依赖 `JsonSerializerOptions.WriteIndented`

开启 WriteIndented = true 会让每个对象带缩进和多行格式，彻底破坏 JSONL 格式（要求每行严格一个对象，且无换行）。结果是：后续工具（如 jq、pandas.read_json(lines=True)）全读不出来，或只读到第一行。

写入时要确保：

每个对象序列化后是单行纯文本，结尾加 \n（不是 \r\n，除非明确目标环境只认 Windows 换行）
用 StreamWriter，并显式调用 WriteLine() ——它自动补 \n，且不加空格或缩进
避免用 Console.WriteLine() 或拼接字符串写入，容易混入不可见字符

示例：

AI抖音

AI抖音，会思考的抖音

下载

using var writer = new StreamWriter("output.jsonl");
foreach (var item in data)
{
    string json = JsonSerializer.Serialize(item, new JsonSerializerOptions
    {
        WriteIndented = false, // 必须关掉
        Encoder = JavaScriptEncoder.UnsafeRelaxedJsonEscaping
    });
    await writer.WriteLineAsync(json); // WriteLine 自动加 \n
}

处理大文件时，`StreamReader.ReadLineAsync` 比同步版更安全

读取几百 MB 甚至 GB 级 JSONL 文件时，同步 ReadLine() 会阻塞线程，拖慢整个应用响应；而 ReadLineAsync() 配合 ConfigureAwait(false) 能释放线程资源，尤其在 ASP.NET Core 后端或长时间运行服务中很关键。

但要注意：

必须在 async 方法里用，别用 .Result 或 .Wait() 强制同步——可能死锁
StreamReader 默认缓冲区是 1024 字节，如果某一行超长（比如嵌入了 base64 图片），可能触发 ArgumentException: Buffer too small；此时应显式传入更大缓冲区，如 new StreamReader(stream, Encoding.UTF8, true, 65536)
不要用 File.ReadLines() ——它底层仍是同步读，且无法控制缓冲区大小

别忽略 BOM 和编码问题，UTF-8 with BOM 会让首行解析失败

Windows 记事本保存的 UTF-8 文件常带 BOM（EF BB BF），导致第一行开头出现非法字符，JsonSerializer.Deserialize() 直接报 InvalidDataException: Invalid prefix 或类似错误，但错误信息不提示 BOM。

稳妥做法：

读取前用 new StreamReader(stream, Encoding.UTF8, true)，第三个参数 detectEncodingFromByteOrderMarks = true 会自动跳过 BOM
写入时用 new StreamWriter(stream, new UTF8Encoding(encoderShouldEmitUTF8Identifier: false)) 确保不写 BOM
如果必须支持带 BOM 的文件，可在读取后对首行做 line.TrimStart('\uFEFF')，但不如让 StreamReader 自动处理干净

真正麻烦的是混合编码文件（比如部分行是 GBK），这种 JSONL 已违反规范，得先统一转码再处理——没有银弹，只能前置清洗。

JavaScript 怎么调用 Blazor 的 C# 方法

C# MAUI怎么调用JavaScript代码 MAUI与WebView交互

.NET 8 Blazor 怎么开启交互式渲染

MAUI怎么从JavaScript调用C#代码 WebView与MAUI通信

Blazor 怎么调用浏览器 API (如地理位置)

相关标签:

js json c# json pandas 字符串线程 console 对象 bom 异步 input windows

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C# Roslyn代码分析器规则文件 C#如何操作.editorconfig和.ruleset文件下一篇：暂无

作者最新文章

DeepSeek网页版和客户端有什么不同？

2026-02-16 14:51

Windows提示“DNS服务器未响应”怎么办 Win10/Win11网络诊断教程

2026-02-16 15:01

手机百度怎么抢高铁票百度APP抢票流程【图文】

2026-02-16 15:11

C语言数据类型表_按字节数、表示范围与格式说明符汇总

2026-02-16 15:19

Win11怎么开启内置的网络诊断修复工具 Windows11修复断网故障教程

2026-02-16 15:27

DeepSeek在游戏NPC对话生成中的应用

2026-02-16 15:41

Win11系统更新太卡顿？教你如何彻底关闭Windows11系统自动更新

2026-02-16 16:21

Chrome浏览器怎么安装Tampermonkey 脚本猫安装教程【指南】

2026-02-16 16:23

Safari浏览器入口网址 Safari浏览器入口在线使用

2026-02-16 16:27

浏览器怎么禁止自动更新浏览器关闭自动升级方法

2026-02-16 16:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

442

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

544

2023.08.23