
1. JSON结构与验证的重要性
json (javascript object notation) 是一种轻量级的数据交换格式,因其简洁性和易于人阅读与编写的特点,在web应用中被广泛使用。json数据由键值对组成的对象({})和值的有序列表的数组([])构成。为了确保数据的正确解析和处理,验证json字符串的结构完整性至关重要。一个结构不正确的json字符串可能导致解析错误或安全漏洞。
2. 栈在括号平衡中的应用
栈(Stack)是一种“后进先出”(LIFO)的数据结构,非常适合用于检查括号、方括号或大括号等配对符号的平衡性。基本原理是:
- 当遇到一个开符号(如 (、{、[)时,将其压入栈中。
- 当遇到一个闭符号(如 )、}、])时,检查栈是否为空。如果为空,则表示没有对应的开符号,结构不平衡。如果栈不为空,则弹出栈顶元素,并检查它是否与当前的闭符号类型匹配。不匹配则结构不平衡。
- 遍历结束后,如果栈为空,则所有符号都已正确匹配;否则,存在未闭合的开符号。
3. JSON字符串验证的特殊挑战
虽然栈能有效处理基本括号平衡,但JSON字符串引入了一些额外的复杂性,需要特别注意:
- 引号与字符串字面量: JSON中的字符串由双引号 " 包裹。在字符串内部,{, }, [, ] 等字符不再具有结构性意义,而应被视为普通数据。因此,验证器必须能够区分它们是在字符串内部还是外部。
- 转义字符: JSON字符串支持转义序列,例如 \" 用于表示字符串中的双引号。验证器需要正确识别 \ 字符,以避免将转义后的 " 错误地解释为字符串的结束符。
- 字符串内部的结构符: 如前所述,{"key": "{value}"} 中的内层 { 和 } 属于字符串内容,不应参与栈的平衡判断。
4. 分析初始实现中的问题
提供的 isValidJSON 方法尝试使用栈来验证JSON,但在处理上述特殊挑战时存在几个关键问题:
-
引号处理逻辑错误:
- 当遇到 " 时,代码会 stack.push(c)。
- 随后,在处理 case '\"' 内部,又再次 stack.push(c)。这导致双引号被重复压入栈中,且弹出逻辑 if (last3 == '\"') { stack.pop(); } else { stack.push(c); } 也未能正确模拟字符串的开始与结束。正确的逻辑应该是当遇到第一个 " 时进入字符串模式,遇到第二个 " 时退出字符串模式。
- 缺乏字符串状态管理: 代码没有明确的机制来判断当前字符是否处于字符串字面量内部。这意味着,像 {"key": "value{}"} 这样的字符串,内部的 {} 也会被错误地推入栈中进行平衡判断,从而导致误判。
- 未处理转义字符: 方法没有考虑 \" 这样的转义序列。如果JSON字符串包含 \",它会被错误地认为是字符串的结束引号。
- 关于"{有效性的误解: 提供的测试用例 assertTrue(JsonValidator.isValidJSON(""{"), "The brackets and quotes are balanced, making this a valid JSON string"); 基于一个根本性的错误理解。一个单独的开大括号 { 并非一个有效的JSON字符串。有效的JSON字符串必须是一个完整的JSON对象(例如 {})、一个JSON数组(例如 [])或一个JSON原始值(例如 null, true, false, 123, "string")。因此,"{ 是一个不完整的、语法错误的JSON片段,其验证结果理应为 false。
5. 构建更健壮的栈基JSON结构验证器
为了解决上述问题,我们需要引入一个状态变量来跟踪是否处于字符串内部,并正确处理转义字符。以下是一个改进后的 isValidJSON 方法:
立即学习“Java免费学习笔记(深入)”;
import java.util.Stack;
public class JsonValidator {
/**
* 验证JSON字符串的结构平衡性(括号、方括号和引号)。
* 注意:此方法仅检查结构平衡,不进行完整的JSON语法或语义验证。
*
* @param jsonString 待验证的JSON字符串
* @return 如果结构平衡且无未闭合的字符串,则返回true;否则返回false。
*/
public static boolean isValidJSON(String jsonString) {
Stack stack = new Stack<>();
boolean inString = false; // 标记是否处于字符串字面量内部
boolean escapeNext = false; // 标记下一个字符是否被转义
for (int i = 0; i < jsonString.length(); i++) {
char c = jsonString.charAt(i);
if (inString) {
// 如果当前在字符串内部
if (escapeNext) {
// 如果前一个字符是反斜杠,则当前字符被转义,跳过处理
escapeNext = false;
} else if (c == '\\') {
// 遇到反斜杠,标记下一个字符将被转义
escapeNext = true;
} else if (c == '\"') {
// 遇到双引号,且未被转义,表示字符串结束
inString = false;
}
// 字符串内部的其他字符(包括 { } [ ])都作为普通数据处理,不影响栈
} else {
// 如果当前不在字符串内部
switch (c) {
case '{':
case '[':
stack.push(c); // 遇到开符号,压入栈
break;
case '}':
// 遇到闭大括号,检查栈是否为空且栈顶是否为对应的开大括号
if (stack.isEmpty() || stack.pop() != '{') {
return false;
}
break;
case ']':
// 遇到闭方括号,检查栈是否为空且栈顶是否为对应的开方括号
if (stack.isEmpty() || stack.pop() != '[') {
return false;
}
break;
case '\"':
// 遇到双引号,进入字符串模式
inString = true;
break;
// 对于逗号、冒号、数字、布尔值、null等,
// 它们是JSON语法的一部分,但对于仅检查括号平衡的栈方法来说,
// 在字符串外部可以忽略它们,因为它们不影响括号平衡。
// 若要进行更严格的JSON语法验证,需要更复杂的解析逻辑。
}
}
}
// 遍历结束后,检查:
// 1. 是否仍在字符串内部(意味着有未闭合的引号)
// 2. 栈是否为空(意味着所有开闭符号都已匹配)
return !inString && stack.isEmpty();
}
// 示例测试
public static void main(String[] args) {
System.out.println("Valid JSON examples:");
System.out.println("\"{}\" is valid: " + isValidJSON("{}")); // true
System.out.println("\"[]\" is valid: " + isValidJSON("[]")); // true
System.out.println("{\"key\": \"value\"} is valid: " + isValidJSON("{\"key\": \"value\"}")); // true
System.out.println("{\"key\": \"value{\\\"inner\\\"}\"} is valid: " + isValidJSON("{\"key\": \"value{\\\"inner\\\"}\"}")); // true
System.out.println("[1, {\"a\": 2}, \"b\"] is valid: " + isValidJSON("[1, {\"a\": 2}, \"b\"]")); // true
System.out.println("\nInvalid JSON examples:");
System.out.println("\"{\" is invalid: " + isValidJSON("{")); // false (未闭合的括号)
System.out.println("\"}\" is invalid: " + isValidJSON("}")); // false (无对应开括号)
System.out.println("\"[\" is invalid: " + isValidJSON("[")); // false (未闭合的方括号)
System.out.println("\"{\\\"\" is invalid: " + isValidJSON("{\"")); // false (未闭合的字符串)
System.out.println("\"{\"key\": \"value\"}} \" is invalid: " + isValidJSON("{\"key\": \"value\"}}")); // false (多余的闭大括号)
System.out.println("\"[{\" is invalid: " + isValidJSON("[{")); // false (未闭合的括号)
System.out.println("\"[\"hello]\" is invalid: " + isValidJSON("[\"hello]\"")); // false (引号内方括号不平衡)
}
} 核心思路:
- 状态变量 inString: 用于跟踪当前解析位置是否在JSON字符串字面量内部。当 inString 为 true 时,{, }, [, ] 等字符不再被视为结构符号,而是字符串内容。
- 转义处理 escapeNext: 当遇到 \ 字符时,将 escapeNext 设为 true,表示下一个字符应被视为普通字符,即使它是 " 或 \。
- 栈操作: 只有当 inString 为 false 时,才对 {, [, }, ] 进行栈的压入和弹出操作。
- 最终检查: 遍历结束后,inString 必须为 false(所有引号已闭合)且 stack 必须为空(所有括号已平衡),才能判定为结构有效。
6. 注意事项与局限性
-
仅限结构平衡: 上述方法仅验证JSON的括号、方括号和引号的平衡性。它不会检查JSON的完整语法规则,例如:
- 键必须是字符串。
- 键值对之间必须有冒号 :。
- 元素之间必须有逗号 ,。
- 值的类型(字符串、数字、布尔值、null、对象、数组)是否合法。
- 数字格式是否正确。
- 对象或数组是否为空。
- 因此,isValidJSON("true") 或 isValidJSON("123") 也会返回 true,因为它们是合法的JSON原始值,且不包含需要平衡的结构符号。
- 推荐使用成熟JSON库: 在实际生产环境中,强烈建议使用成熟的JSON解析库(如 Jackson, Gson, org.json)来进行JSON字符串的验证和解析。这些库提供了完整的JSON语法验证、错误处理和数据绑定功能,能够更全面、更健鲁地处理各种复杂的JSON场景。例如,尝试解析JSON字符串,如果解析成功则认为其有效,否则捕获异常。
- "{ 非有效JSON: 再次强调,单个开括号 { 或 [ 并非有效的JSON字符串。有效的JSON字符串必须是一个完整的JSON文档,例如 {}, [], "hello", 123, true 等。在编写测试用例时,应遵循JSON规范。
通过理解栈的工作原理,并结合状态管理来处理JSON字符串的特殊性,我们可以构建一个相对健壮的结构平衡验证器。然而,对于完整的JSON语法验证,专业的JSON解析库是更优的选择。










