0

0

PHP 中解析无分隔符的坏 JSON 字符串(如连续 JSON 对象块)

花韻仙語

花韻仙語

发布时间:2026-03-14 20:31:01

|

109人浏览过

|

来源于php中文网

原创

PHP 中解析无分隔符的坏 JSON 字符串(如连续 JSON 对象块)

本文介绍如何在 php 中处理格式错误的 json 文件——多个 json 对象紧挨着拼接(无换行、无逗号、缺左引号),通过字符串预处理将其转换为标准 json 数组,再安全解析并提取 timestamp 和 order_id 字段。

本文介绍如何在 php 中处理格式错误的 json 文件——多个 json 对象紧挨着拼接(无换行、无逗号、缺左引号),通过字符串预处理将其转换为标准 json 数组,再安全解析并提取 timestamp 和 order_id 字段。

在实际开发中,我们常会遇到非标准 JSON 数据源:例如日志系统导出的“伪 JSON”文件,其内容为多个 JSON 对象连续拼接(如 {...}{...}{...}),既无换行分隔,也缺少数组外壳和对象间逗号,甚至存在语法缺陷(如 "timestamp" 误写为 timestamp")。这类数据无法直接用 json_decode() 解析。本文提供一种稳健、低依赖的 PHP 处理方案,无需正则回溯或外部库,适用于中小型数据量场景。

核心思路:修复为合法 JSON 数组

关键在于将原始字符串转化为符合 RFC 8259 的 JSON 文本。观察示例:

{timestamp":"2022-03-25 00:25:41.476+00","order_id":"1659616"}{timestamp":"2022-03-25 00:18:51.892+00","order_id":"1560808"}

存在三处典型问题:

  • 缺少首字段键名的左引号 → timestamp" → "timestamp"
  • 相邻对象间无分隔符 → }{ → }, {
  • 整体无数组包裹 → 需补 []

因此,修复流程为:

聚好用AI
聚好用AI

可免费AI绘图、AI音乐、AI视频创作,聚集全球顶级AI,一站式创意平台

下载

立即学习PHP免费学习笔记(深入)”;

  1. 读取整个文件内容(注意:file() 默认按行读取,但本例无换行,故需 file_get_contents());
  2. 补全数组外壳:在开头加 [,结尾加 ];
  3. 修复缺失引号:全局替换 timestamp" 为 "timestamp"(若存在其他字段如 order_id",同理处理);
  4. 插入对象分隔符:将 }{ 替换为 }, {;
  5. 调用 json_decode($json, true) 安全解析。

完整可运行代码示例

<?php
$filePath = 'abovefile.txt';

// 步骤1:读取完整文件内容(非 file(),因无换行)
$content = file_get_contents($filePath);
if ($content === false) {
    throw new RuntimeException("无法读取文件: {$filePath}");
}

// 步骤2–4:字符串预处理(顺序敏感!)
$json = '[' . $content . ']';
$json = str_replace('timestamp"', '"timestamp"', $json);      // 修复 timestamp 键
$json = str_replace('order_id"', '"order_id"', $json);        // 修复 order_id 键(推荐一并处理)
$json = str_replace('}{', '}, {', $json);                      // 分割对象

// 步骤5:解析并验证
$data = json_decode($json, true);
if (json_last_error() !== JSON_ERROR_NONE) {
    throw new RuntimeException('JSON 解析失败: ' . json_last_error_msg());
}

// 提取所需字段并输出
foreach ($data as $index => $item) {
    echo "条目 {$index}: \n";
    echo "  Timestamp: {$item['timestamp']}\n";
    echo "  Order ID:  {$item['order_id']}\n";
}
?>

注意事项与健壮性增强建议

  • 优先使用 file_get_contents():原问题中 foreach(file(...)) 假设按行读取,但该文件无换行符,会导致整个内容被当作单行读入 $line[0],虽偶然可行,但语义错误;file_get_contents() 更准确、高效。
  • ⚠️ 字段修复需覆盖全部键名:示例中仅展示 timestamp 和 order_id,若实际含 user_id、amount 等,须逐个添加 str_replace() 或改用正则(如 preg_replace('/([a-zA-Z_][a-zA-Z0-9_]*)":/', '"$1":', $json))。
  • ? 务必校验 json_decode() 结果:始终检查 json_last_error(),避免静默失败导致空数组或 null。
  • ? 大数据量慎用字符串替换:若文件超 10MB,多次 str_replace() 可能影响性能,此时建议流式解析(如逐字符状态机识别 {/} 边界),但本方案已满足绝大多数运维与 ETL 场景。
  • ? 扩展性提示:若格式存在更多变体(如空格不一致、末尾逗号等),可集成 jsonlint 类库进行二次校验,或使用 spatie/json-api-parser 等容错解析器。

通过以上方法,您能将混乱的 JSON 片段快速转化为结构化 PHP 数组,实现可靠的数据提取。核心在于理解:JSON 解析器只认标准语法,而数据清洗是开发者不可回避的前置责任。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

549

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1109

2024.03.01

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

267

2025.12.04

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号