C++手写JSON解析器核心是用Variant类统一表示6种JSON类型,通过递归下降解析字符流,结合peek/consume/expect控制流程,分步实现并强化错误处理。

用C++写一个简单的JSON解析器,核心是理解JSON的两种基本结构(值和容器)以及递归解析逻辑。不需要依赖第三方库,手写能帮你深入掌握字符串处理、状态机思想和树形数据结构构建。
JSON结构特点与C++建模
JSON只有6种类型:字符串、数字、布尔、null、数组、对象。C++中可用一个Variant类统一表示任意JSON值,内部用std::variant(C++17)或联合体+类型标记实现:
- 字符串 →
std::string - 数字 →
double(兼顾整数与浮点) - 布尔/Null →
bool和自定义枚举json_null - 数组 →
std::vector - 对象 →
std::map<:string json>
把整个JSON抽象为一个可嵌套的Json类,支持拷贝、访问、打印,这是解析结果的“载体”。
解析流程:跳过空白 + 类型分发 + 递归下降
解析不是一气读完,而是按字符流推进,关键在当前位置的首字符决定下一步:
立即学习“C++免费学习笔记(深入)”;
-
'{'→ 解析对象:读键(字符串)、冒号、值(递归调用parse_value())、逗号分隔 -
'['→ 解析数组:逐个parse_value(),用逗号分隔,直到遇到']' -
'"'→ 解析字符串:处理转义(\" \\\\ \\/ \b \f \n \r \t),注意Unicode代理对可暂忽略 -
't','f','n'→ 分别匹配true、false、null - 数字开头(
-或数字)→ 用std::stod或手动解析避免精度丢失
写一个私有成员char peek()查看当前字符不移动位置,void consume()跳过当前字符,再配合expect(char c)校验预期符号——这是控制解析节奏的基础。
错误处理与边界细节
简单不等于忽略错误。至少应检测:
- 字符串没闭合引号(遇到换行或EOF)
- 对象里键不是字符串(如
{42: "x"}非法) - 数字格式错误(如
12e、012前导零——严格JSON不允许) - 意外字符(如
{ "a": 1 }xxx后面多出内容)
建议用std::optional作parse函数返回值,解析失败时返回空;或抛出带位置信息的std::runtime_error(如"expected ',' at line 5, col 12")。
动手建议:分步实现,先跑通再加固
别一上来就写全功能。推荐顺序:
- 第一步:只支持
null、true、false,验证基础流程 - 第二步:加上字符串(含简单转义),能解析
{"name":"Tom"} - 第三步:支持数字和数组,如
[1,2.5,"x"] - 第四步:补全对象解析,支持嵌套:
{"a":[1,{"b":true}]}
每步写几个测试用例(用assert或简易check宏),比盲目堆代码更高效。完成后,你对词法分析、递归下降、内存管理的理解会明显加深。











