0

0

attrs 与 cattrs:优雅处理嵌套数据结构的教程

霞舞

霞舞

发布时间:2025-08-05 23:02:25

|

223人浏览过

|

来源于php中文网

原创

attrs 与 cattrs:优雅处理嵌套数据结构的教程

本教程详细阐述了如何使用 Python 的 attrs 和 cattrs 库来高效处理嵌套的数据结构,特别是将包含字典列表的复杂数据转换为 attrs 定义的类实例列表。文章将解释 attrs 内置转换器的局限性,并演示 cattrs 如何通过其强大的结构化功能,自动且优雅地完成从原始字典数据到复杂 attrs 对象的映射,从而简化代码并提高可维护性。

理解 attrs 中的数据建模

python 中,attrs 库提供了一种简洁而强大的方式来定义结构化数据类,它通过装饰器和类型提示极大地简化了样板代码。当我们需要将外部数据(如 json 或字典)映射到这些定义好的 attrs 类时,通常会遇到嵌套结构的处理问题。

考虑一个场景,我们有一组角色数据,每个角色包含姓名信息,并且这些角色共同构成一个团队。数据结构如下所示:

data_source = {
    "characters": [
        {"first_name": "Duffy", "last_name": "Duck"},
        {"first_name": "Bugs", "last_name": "Bunny"},
        # ... 更多角色
    ]
}

我们希望将其转换为 attrs 类实例:

from attrs import define, field
from typing import List

@define(kw_only=True)
class Character:
    first_name: str
    last_name: str

@define
class LooneyToons:
    characters: List[Character] = field(factory=list) # 初始定义,稍后解释为何移除converter

attrs 内置转换器的局限性

attrs 提供了 converter 参数,用于在字段赋值时对输入值进行转换。例如,some_field: int = field(converter=int) 可以确保输入值被转换为整数。然而,当处理列表中的复杂对象转换时,直接使用 converter=Character 会遇到问题:

# 错误示例:直接将 Character 作为 List[Character] 的 converter
@define
class LooneyToons_Problematic:
    characters: List[Character] = field(factory=list, converter=Character)

# 尝试使用:
# LooneyToons_Problematic(characters=data_source['characters'])
# 这将导致 TypeError: Character.__init__() takes 1 positional argument but 2 were given

这个错误的原因是,attrs 的 converter 期望一个函数,该函数接收单个值并将其转换为目标类型。当我们将其应用于一个 List[Character] 字段时,attrs 会尝试将整个列表 data_source['characters'] 作为参数传递给 Character 类的构造函数(即 Character.__init__),这显然是不正确的,因为 Character 期望的是 first_name 和 last_name 这样的关键字参数,而不是一个字典列表。

手动转换与其不足

一种可行的解决方案是手动遍历列表,并为每个字典创建 Character 实例:

# 手动转换示例
looney_tunes_instance = LooneyToons(
    characters=[Character(**x) for x in data_source['characters']]
)
print(looney_tunes_instance)
# 输出: LooneyToons(characters=[Character(first_name='Duffy', last_name='Duck'), ...])

这种方法虽然有效,但在以下情况下显得不够优雅或高效:

  • 样板代码重复: 每次需要转换列表时,都需要编写类似的列表推导式。
  • 可读性下降: 随着数据结构的复杂性增加,手动转换逻辑会变得冗长且难以维护。
  • 不自动化: 无法在 LooneyToons 类的实例化过程中自动完成,需要外部手动处理。

引入 cattrs:自动化复杂数据结构转换

为了更优雅、自动化地处理 attrs 类与复杂嵌套数据(如字典、列表)之间的转换,cattrs 库应运而生。cattrs 是一个强大的工具,专门用于在 Python 对象和原始数据类型之间进行结构化(structuring)和非结构化(unstructuring)。它通过利用类型提示,能够智能地解析复杂的数据结构并自动执行深层转换。

Manus
Manus

全球首款通用型AI Agent,可以将你的想法转化为行动。

下载

使用 cattrs 解决上述问题非常简单:

  1. 移除 converter 参数: 在 LooneyToons 类的 characters 字段定义中,我们不再需要 converter 参数。cattrs 将根据类型提示 List[Character] 自动推断出正确的转换逻辑。

  2. 使用 cattrs.structure: 调用 cattrs.structure() 函数,将原始字典数据和目标 attrs 类作为参数传入。

以下是完整的 cattrs 解决方案代码:

from typing import List
from attrs import define, field
from cattrs import structure # 导入 cattrs 的 structure 函数

# 示例数据
data_source = {
    "characters": [
        {"first_name": "Duffy", "last_name": "Duck"},
        {"first_name": "Bugs", "last_name": "Bunny"},
        {"first_name": "Sylvester", "last_name": "Pussycat"},
        {"first_name": "Elmar", "last_name": "Fudd"},
        {"first_name": "Tweety", "last_name": "Bird"},
        {"first_name": "Sam", "last_name": "Yosemite"},
        {"first_name": "Wile E.", "last_name": "Coyote"},
        {"first_name": "Road", "last_name": "Runner"},
    ]
}

# 定义内部的 Character 类
@define(kw_only=True)
class Character:
    first_name: str
    last_name: str

# 定义外部的 LooneyToons 类,注意移除了 converter 参数
@define
class LooneyToons:
    characters: List[Character] = field(factory=list)

# 使用 cattrs.structure 进行转换
looney_tunes_instance = structure(data_source, LooneyToons)

print(looney_tunes_instance)
# 预期输出:
# LooneyToons(characters=[Character(first_name='Duffy', last_name='Duck'), Character(first_name='Bugs', last_name='Bunny'), Character(first_name='Sylvester', last_name='Pussycat'), Character(first_name='Elmar', last_name='Fudd'), Character(first_name='Tweety', last_name='Bird'), Character(first_name='Sam', last_name='Yosemite'), Character(first_name='Wile E.', last_name='Coyote'), Character(first_name='Road', last_name='Runner')])

# 验证类型
print(isinstance(looney_tunes_instance.characters[0], Character)) # True

在这个例子中,cattrs.structure(data_source, LooneyToons) 会执行以下操作:

  1. 它检查 LooneyToons 的类型提示。
  2. 发现 characters 字段被标注为 List[Character]。
  3. cattrs 遍历 data_source['characters'] 中的每个字典。
  4. 对于每个字典,cattrs 知道它需要将其转换为一个 Character 实例,因此它会自动调用 Character(**dict_item) 来创建对象。
  5. 最终,所有创建的 Character 实例被收集到一个列表中,并赋值给 looney_tunes_instance.characters。

总结与注意事项

  • attrs 的 converter vs. cattrs.structure: attrs 内置的 converter 适用于简单的、单值到单值的转换。当需要处理嵌套对象、列表或更复杂的类型映射时,cattrs 是更专业、更强大的选择。
  • 类型提示的重要性: cattrs 严重依赖于 Python 的类型提示来理解如何进行数据结构化。确保你的 attrs 类字段都带有准确的类型提示。
  • 灵活性与扩展性: cattrs 提供了注册自定义转换器(register_structure_hook)的能力,这使得它能够处理各种非标准的数据类型或特殊的转换逻辑,进一步增强了其灵活性。
  • 减少样板代码: 通过使用 cattrs,你可以将数据转换的复杂逻辑从业务代码中解耦,使得 attrs 类的定义更加纯粹,只关注数据结构本身。

通过结合 attrs 定义清晰的数据模型和 cattrs 自动化数据映射,开发者可以更高效、更优雅地处理 Python 中的复杂数据结构,显著提高代码的可读性、可维护性和健壮性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

420

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

536

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

463

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

544

2024.08.29

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

8

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号