0

0

将JSON数据转换为DataFrame的实用指南

碧海醫心

碧海醫心

发布时间:2025-08-24 16:46:23

|

1060人浏览过

|

来源于php中文网

原创

将json数据转换为dataframe的实用指南

本文档旨在指导开发者如何使用Python将JSON文件中的数据加载到Pandas DataFrame中,并正确地将数据分配到对应的列。通过解析JSON结构,提取数据和列名,并使用Pandas库创建DataFrame,实现数据的有效组织和分析。

从JSON到DataFrame:数据转换详解

在数据处理过程中,JSON(JavaScript Object Notation)作为一种常见的数据交换格式,经常需要被转换成更易于分析和操作的数据结构,例如Pandas DataFrame。本教程将详细介绍如何使用Python将JSON数据加载到DataFrame,并正确地将数据分配到对应的列。

1. 准备工作

首先,确保已经安装了必要的Python库:pandas 和 json。如果尚未安装,可以使用以下命令安装:

pip install pandas

json 库通常是Python标准库的一部分,无需额外安装。

2. 加载JSON数据

假设我们有以下JSON数据,存储在名为 data.json 的文件中:

{
    "data": [
        [
            "2023-01-01",
            50,
            50,
            82,
            0.0,
            4.32,
            0.1,
            0
        ],
        [
            "2023-01-02",
            298,
            315,
            550,
            0.0,
            4.920634920634921,
            0.13758389261744966,
            0
        ],
        [
            "2023-01-03",
            709,
            724,
            1051,
            0.0,
            3.064917127071823,
            0.0930888575458392,
            0
        ],
        [
            "2023-01-04",
            264,
            292,
            660,
            0.0,
            6.493150684931507,
            0.2803030303030303,
            0
        ],
        [
            "2023-01-05",
            503,
            523,
            882,
            0.0,
            3.7667304015296366,
            0.14314115308151093,
            0
        ],
        [
            "2023-01-06",
            423,
            437,
            735,
            0.0,
            3.5652173913043477,
            0.12056737588652482,
            0
        ],
        [
            "2023-01-07",
            97,
            102,
            146,
            0.0,
            3.5294117647058822,
            0.13402061855670103,
            0
        ],
        [
            "2023-01-08",
            70,
            71,
            169,
            0.0,
            6.52112676056338,
            0.1,
            0
        ],
        [
            "2023-01-09",
            301,
            337,
            721,
            0.0,
            5.9614243323442135,
            0.26578073089701,
            0
        ],
        [
            "2023-01-10",
            313,
            352,
            678,
            0.0,
            5.8522727272727275,
            0.2364217252396166,
            0
        ]
    ],
    "meta": {
        "columns": [
            "timestamp__to_date",
            "visitors",
            "sessions",
            "page_views",
            "goal_conversion_rate",
            "events_per_session",
            "returning_visitors_rate",
            "goal_conversions"
        ],
        "count": 181
    }
}

使用以下代码加载JSON数据:

Caktus AI
Caktus AI

Caktus AI 是一个专为学生和教师打造的教育工具,可以帮助论文写作、数学问题、编程助手、语言学习等等!

下载
import json
import pandas as pd

with open('data.json', 'r') as f:
    data = json.load(f)

3. 创建DataFrame

从JSON数据中提取数据和列名,然后使用pandas.DataFrame构造函数创建DataFrame:

df = pd.DataFrame(data['data'], columns=data['meta']['columns'])
print(df)

这段代码首先从加载的JSON数据中提取 data 列表和 meta.columns 列表。然后,它使用这些数据创建一个DataFrame,其中 data 列表作为DataFrame的数据,meta.columns 列表作为列名。

4. 结果展示

执行上述代码后,将得到如下DataFrame:

  timestamp__to_date  visitors  sessions  page_views  goal_conversion_rate  events_per_session  returning_visitors_rate  goal_conversions
0         2023-01-01        50        50          82                   0.0            4.320000                 0.100000                 0
1         2023-01-02       298       315         550                   0.0            4.920635                 0.137584                 0
2         2023-01-03       709       724        1051                   0.0            3.064917                 0.093089                 0
3         2023-01-04       264       292         660                   0.0            6.493151                 0.280303                 0
4         2023-01-05       503       523         882                   0.0            3.766730                 0.143141                 0
5         2023-01-06       423       437         735                   0.0            3.565217                 0.120567                 0
6         2023-01-07        97       102         146                   0.0            3.529412                 0.134021                 0
7         2023-01-08        70        71         169                   0.0            6.521127                 0.100000                 0
8         2023-01-09       301       337         721                   0.0            5.961424                 0.265781                 0
9         2023-01-10       313       352         678                   0.0            5.852273                 0.236422                 0

5. 注意事项

  • 数据类型: JSON数据中的数值类型在转换为DataFrame后,可能会被自动推断为整数或浮点数。如果需要指定数据类型,可以在创建DataFrame后使用astype方法进行转换。
  • 缺失值: 如果JSON数据中存在缺失值(例如null),Pandas会将它们转换为NaN。可以使用fillna方法填充缺失值。
  • 编码问题: 如果JSON文件使用了特定的编码(例如UTF-8),请确保在读取文件时指定正确的编码。

总结

本教程介绍了如何使用Python将JSON数据加载到Pandas DataFrame中,并正确地将数据分配到对应的列。通过加载JSON数据、提取数据和列名、创建DataFrame等步骤,可以实现数据的有效组织和分析。在实际应用中,可以根据具体需求进行适当的调整和优化。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

418

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

535

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

56

2025.12.04

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

235

2023.09.22

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号