如何将字符串形式的字典列安全解析并展开为多列

聖光之護

发布时间：2026-01-25 10:18:02

223人浏览过

来源于php中文网

原创

如何将字符串形式的字典列安全解析并展开为多列

本文介绍如何在 python 中安全地将 dataframe 中存储为字符串的字典（如 `"{827056812014862: [0.05, 0.0608, 0.476464, 0.53535]}"`）解析为结构化表格，提取键为 `id`、列表元素依次映射为 `t1`, `t2`, `t3`, `t4` 等独立列。

在实际数据处理中，常遇到将嵌套结构以字符串形式存储于单列的情况（例如日志导出、API 响应或低规范数据库导出）。直接使用 eval() 解析存在严重安全风险，推荐使用 ast.literal_eval() —— 它仅支持安全的字面量（如 dict、list、float、int、str），可有效防止代码注入。

以下是一个完整、健壮的解决方案：

import pandas as pd
from ast import literal_eval

# 示例原始数据
df = pd.DataFrame({
    "column_A": [
        "{827056812014862: [0.05, 0.0608, 0.476464, 0.53535]}",
        "{263746262748835: [0.08, 0.0333, 0.8263, 0.9463]}",
        "{63673738736362: [0.05, 0.0926, 0.8694, 0.9903]}",
        "{73737681201484: [0.08, 0.0425, 0.1948, 0.3958]}"
    ]
})

# 安全解析 + 展开为标准 DataFrame
records = []
for s in df["column_A"]:
    try:
        d = literal_eval(s)  # 安全转换字符串为 dict
        for key, values in d.items():
            if isinstance(values, (list, tuple)) and len(values) == 4:
                records.append({
                    "id": key,
                    "t1": values[0],
                    "t2": values[1],
                    "t3": values[2],
                    "t4": values[3]
                })
            else:
                raise ValueError(f"Unexpected value format: {values}")
    except (ValueError, SyntaxError) as e:
        print(f"Warning: Skipping invalid string '{s}' — {e}")
        continue

result = pd.DataFrame(records)
print(result)

✅ 输出结果与预期一致：

意兔-AI漫画相机

照片变漫画手绘，做周边好物

下载

                id    t1      t2        t3       t4
0  827056812014862  0.05  0.0608  0.476464  0.53535
1  263746262748835  0.08  0.0333  0.826300  0.94630
2   63673738736362  0.05  0.0926  0.869400  0.99030
3   73737681201484  0.08  0.0425  0.194800  0.39580

? 关键注意事项：

✅ 永远避免 eval()：它可执行任意 Python 表达式，存在严重安全隐患；literal_eval() 是唯一推荐替代方案。
⚠️ 添加异常处理：真实数据中可能存在格式错误、空值或长度不一致的列表，务必用 try/except 包裹解析逻辑。
? 扩展性建议：若列表长度不固定，可用 **{f"t{i}": v for i, v in enumerate(values, 1)} 动态生成列名（如答案中所示），再通过 pd.json_normalize() 或 pd.concat() 统一列结构。
? 性能优化（大数据量）：对超大规模数据，可改用 apply + pd.Series 向量化展开（需确保每行仅含一个 key-value 对），但需注意内存开销。

该方法兼顾安全性、可读性与工程鲁棒性，适用于 ETL 流程、数据清洗及 Pandas 标准化预处理场景。

Django怎么安装_pip安装Django与创建第一个Project

Python并查集怎么写_Disjoint Set路径压缩与连通性判断

Python怎么跨平台迁移_Windows到Linux项目环境同步技巧

Python无根权限怎么装库_使用--user参数安装到用户目录

如何健壮处理用户输入中的空白字符与非法内容

相关标签:

python js json 大数据 ai 数据清洗 pandas Float for try 字符串 int 数据库 etl 性能优化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何用 SymPy 精确计算形如 (m/n)π 的正弦与余弦值下一篇：如何检测当前代码是否运行在 uvloop 加速的事件循环中

作者最新文章

Go 中为何不能直接转换切片类型？深入解析类型转换规则与安全替代方案

2026-03-12 09:23

Vue 中实现多选限制：仅允许勾选 3 项，其余自动禁用（支持反选）

2026-03-12 09:25

OpenGL 3.x 渲染 20K 精灵体（Sprites）性能优化实战指南

2026-03-12 09:26

上海停车app如何进行预约

2026-03-12 09:27

vscode源控件里怎么好多数字

2026-03-12 09:43

Java 中正确解码 Unicode 私用区（PUA）字符的完整指南

2026-03-12 09:46

《生化危机9》MOD让疯狂难度更难被丧尸咬了会感染

2026-03-12 09:47

如何让图片的20%移出网页可视区域实现“半隐式”视觉效果

2026-03-12 10:09

如何在 Go 的 flag 包中为必需的位置参数提供清晰的 Usage 提示

2026-03-12 10:10

如何让图片的20%移出视口实现“半隐式”边缘展示效果

2026-03-12 10:24

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

595

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

108

2025.10.23

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

651

2023.11.24

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

热门下载

网站特效

网站源码

网站素材

前端模板