0

0

C++如何解析带有中文字符的JSON_C++使用nlohmann处理编码方案【避坑】

冰火之心

冰火之心

发布时间:2026-02-08 13:22:37

|

806人浏览过

|

来源于php中文网

原创

nlohmann::json默认解析中文乱码是因为它只接受UTF-8编码,若输入为GBK等非UTF-8编码会因非法UTF-8字节抛出parse_error异常;必须在调用json::parse()前将源数据显式转为UTF-8。

c++如何解析带有中文字符的json_c++使用nlohmann处理编码方案【避坑】

为什么nlohmann::json默认解析中文会乱码

nlohmann::json本身不处理字符编码转换,它只负责JSON语法解析和序列化。当输入字符串是UTF-8编码(标准JSON要求),而你的源数据实际是GBK、GB2312或系统本地编码(如Windows的CP936)时,nlohmann::json会把非ASCII字节当作非法UTF-8序列,抛出parse_error异常,错误信息类似"[json.exception.parse_error.101] parse error at line 1, column 2: syntax error while parsing value - invalid string: ill-formed UTF-8 byte

常见场景:从文件读取、std::cin输入、Qt的QFile或MFC的CStdioFile读出的中文文本,多数未转UTF-8就直接喂给json::parse()

如何确保输入是合法UTF-8再交给nlohmann

核心原则:nlohmann只接受UTF-8,所有中文字符必须在调用json::parse()前完成编码转换。

  • 如果源是Windows控制台或ANSI文件(CP936):
    MultiByteToWideChar(CP_ACP, ...) + WideCharToMultiByte(CP_UTF8, ...)转为UTF-8字符串,再构造std::string传入json::parse()
  • 如果源是Qt:QString::toUtf8().toStdString() 是安全的,但注意QString本身是UTF-16,需确认原始加载方式(如QTextCodec::codecForName("GBK")->toUnicode()后再toUtf8()
  • 如果源是C++11 std::ifstream读取的文本文件:
     • 不要用std::getline()直接读到std::string后就parse —— 文件若存为ANSI,读出的就是乱码字节
     • 先用工具(如Notepad++)确认文件编码;若为GBK,需用第三方库(如iconvutf8cpp)转码
  • Linux/macOS下一般默认UTF-8,但仍建议用file -i filename.json验证

避免用std::wifstream + std::wstring绕过问题

有人尝试用宽字符流读取再转json::parse(),这是无效路径:nlohmann::json没有parse(const std::wstring&)重载,且其内部字符串存储为std::string(UTF-8),强行用std::wstring_convert<:codecvt_utf8>>(已弃用)或std::from_chars等转换极易出错。

立即学习C++免费学习笔记(深入)”;

  • std::wifstream默认按本地宽编码(如Windows是UTF-16 LE),但JSON规范禁止BOM和UTF-16编码
  • 即使读成功,std::wstring含\0或代理对(surrogate pair)时,转UTF-8过程若漏处理,仍会导致parse_error
  • 直接操作UTF-8 std::string是最小可信路径,其他中间编码层都是风险点

调试时快速验证JSON字符串是否UTF-8合法

别靠肉眼判断中文是否“看起来正常”——要验证字节序列。

  • 在代码中加断点,打印json_string.data()前几个字节(十六进制),中文UTF-8通常是3字节序列(如"你好" → E4 BD A0 E5 A5 BD
  • 用命令行工具验证:echo -n '{"name":"你好"}' | iconv -f utf-8 -t utf-8 //check(Linux)或Python一行:python3 -c "import json; json.loads('''{\"name\":\"你好\"}''')"
  • 若用VS调试,可在监视窗口输入json_string.c_str(),su(显示UTF-8字符串),而非json_string.c_str()(可能被当成ANSI)

nlohmann对中文没特殊逻辑,它的“坑”全来自你传进去的字节不是UTF-8——这个边界必须守死,任何想让库替你猜编码的做法都会在某个客户环境突然崩掉。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
视频后缀名都有哪些
视频后缀名都有哪些

视频后缀名都有avi、mpg、mpeg、rm、rmvb、flv、wmv、mov、mkv、ASF、M1V、M2V、MPE、QT、VOB、RA、RMJ、RMS、RAM、等等。更多关于视频后缀名的相关知识,详情请看本专题下面的文章,php中文网欢迎大家前来学习。

3588

2023.10.31

C++ Qt图形开发
C++ Qt图形开发

本专题专注于 C++ Qt框架在图形界面开发中的应用,系统讲解窗口设计、信号与槽机制、界面布局、事件处理、数据库连接与跨平台打包等核心技能,通过多个桌面应用项目实战,帮助学员快速掌握 Qt 框架并独立完成跨平台GUI软件的开发。

71

2025.08.15

C++ 图形界面开发基础(Qt方向)
C++ 图形界面开发基础(Qt方向)

本专题系统讲解 使用 C++ 与 Qt 进行图形界面(GUI)开发的核心技能,内容涵盖 Qt 项目结构、窗口组件、信号与槽机制、事件处理、布局管理、资源管理,以及跨平台编译与打包流程。通过多个小型桌面应用实战案例,帮助学习者掌握从界面设计到功能实现的完整 GUI 开发能力。

82

2025.12.05

json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

431

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

543

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

314

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

79

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

626

2023.08.02

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

61

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.7万人学习

Git 教程
Git 教程

共21课时 | 3.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号