0

0

DuckDB SQL 查询结果直接转换为 JSON 的方法与实践

聖光之護

聖光之護

发布时间:2025-11-27 12:50:02

|

690人浏览过

|

来源于php中文网

原创

DuckDB SQL 查询结果直接转换为 JSON 的方法与实践

本文详细介绍了在 duckdb 中如何直接将 sql 查询结果转换为 json 格式,无需借助外部编程语言或中间对象转换。核心方法是利用 duckdb 的 `list` 聚合函数和 `struct` 数据类型,通过 sql 语句构建结构化数据并直接转换为 json。教程提供了两种实现方式:使用花括号 `{}` 定义结构体和使用 `struct_pack()` 函数,并附带了完整的示例代码和预期输出,帮助用户高效地在数据库层完成数据格式转换。

DuckDB SQL 查询结果直接转换为 JSON

在数据处理和应用开发中,将数据库查询结果转换为 JSON 格式是一种常见需求。虽然许多编程语言客户端(如 Python)可以先将查询结果转换为数据帧或对象,再序列化为 JSON,但 DuckDB 提供了更为直接和高效的 SQL 解决方案,允许用户在数据库内部直接完成这一转换,从而减少数据传输和处理的开销。本文将详细介绍如何利用 DuckDB 的 LIST 聚合函数和 STRUCT 数据类型来实现这一目标。

核心概念

要将表格的列数据聚合成 JSON 数组,并以键值对的形式组织,我们需要理解 DuckDB 中的两个关键功能:

  1. LIST 聚合函数:此函数可以将指定列的所有值聚合到一个列表中。例如,list(column_name) 会返回该列所有行的值组成的列表。
  2. STRUCT 数据类型:结构体(STRUCT)是一种复合数据类型,允许将多个不同类型的值打包成一个单一的结构。在 DuckDB SQL 中,可以通过两种方式定义结构体:使用花括号 {} 或 struct_pack() 函数。结构体非常适合表示 JSON 对象中的键值对。

结合这两者,我们可以先用 LIST 聚合每列的数据,然后将这些列表作为 STRUCT 的字段值,最后将整个 STRUCT 显式地转换为 JSON 类型。

示例数据准备

为了演示,我们首先创建一个 weather 表并插入一些示例数据:

CREATE TABLE weather (
      city    VARCHAR,
      temp_lo INTEGER, -- minimum temperature on a day
      temp_hi INTEGER, -- maximum temperature on a day
      prcp    REAL,
      date    DATE
  );
INSERT INTO weather VALUES ('San Francisco', 46, 50, 0.25, '1994-11-27');
INSERT INTO weather VALUES ('Vienna', -5, 35, 10, '2000-01-01');
INSERT INTO weather VALUES ('London', 10, 20, 5.5, '2023-03-15');

方法一:使用花括号 {} 定义结构体

这是定义结构体最简洁的方式。我们通过 {key: value, ...} 的语法来创建一个结构体,其中 key 是 JSON 字段名,value 是通过 list() 聚合函数得到的列数据列表。最后,使用 ::JSON 进行类型转换,将其转换为 JSON 格式。

假设我们想将 city 和 temp_hi 列转换为 JSON,格式为 {"city": ["San Francisco", "Vienna", "London"], "temp_hi": [50, 35, 20]}。

SELECT {city: list(city), temp_hi: list(temp_hi)}::JSON AS j FROM weather;

代码解析:

KAIZAN.ai
KAIZAN.ai

使用AI来改善客户服体验,提高忠诚度

下载
  • list(city):将 city 列的所有值聚合成一个列表 ["San Francisco", "Vienna", "London"]。
  • list(temp_hi):将 temp_hi 列的所有值聚合成一个列表 [50, 35, 20]。
  • {city: ..., temp_hi: ...}:定义一个结构体,其中 city 是键,list(city) 的结果是其值;temp_hi 是键,list(temp_hi) 的结果是其值。
  • ::JSON:将生成的结构体强制转换为 JSON 数据类型。

方法二:使用 struct_pack() 函数定义结构体

struct_pack() 函数提供了另一种更显式地创建结构体的方式。它的语法是 struct_pack(key1 := value1, key2 := value2, ...)。这种方式在某些情况下可能更具可读性,尤其是在字段名与列名不同时。

同样,我们将 city 和 temp_hi 列转换为 JSON:

SELECT struct_pack(city := list(city), temp_hi := list(temp_hi))::JSON AS j FROM weather;

代码解析:

  • struct_pack(...):调用 struct_pack 函数来创建结构体。
  • city := list(city):指定结构体中的一个字段,键为 city,值为 list(city) 的结果。
  • temp_hi := list(temp_hi):指定结构体中的另一个字段,键为 temp_hi,值为 list(temp_hi) 的结果。
  • ::JSON:将生成的结构体强制转换为 JSON 数据类型。

预期输出

无论采用哪种方法,上述查询都将产生相同的 JSON 输出结果:

┌───────────────────────────────────────────────────────────────────┐
│                                 j                                 │
│                               json                                │
├───────────────────────────────────────────────────────────────────┤
│ {"city":["San Francisco","Vienna","London"],"temp_hi":[50,35,20]} │
└───────────────────────────────────────────────────────────────────┘

总结与注意事项

  • 直接性与效率:这种方法直接在 SQL 层完成 JSON 转换,避免了数据在数据库和应用程序之间来回传输,提高了效率,尤其适用于大数据集。
  • 灵活性:你可以根据需要选择任意列进行聚合,并将其包含在最终的 JSON 结构中。
  • JSON 结构:这种方法生成的 JSON 结构是每个键对应一个值数组。如果需要每行数据作为一个独立的 JSON 对象,然后将所有对象放入一个 JSON 数组中,则需要结合 to_json 函数和 array_agg 函数,这属于另一种高级用法。
  • 错误处理:确保聚合的列数据类型与 JSON 兼容。DuckDB 会自动处理基本类型的转换。
  • DuckDB 版本:确保您的 DuckDB 版本支持 LIST 聚合函数和 STRUCT 类型以及 ::JSON 转换。这些功能在较新版本的 DuckDB 中是标准配置。

通过掌握上述技术,开发者可以更有效地利用 DuckDB 的强大功能,直接在数据库层处理和格式化数据,从而简化应用程序逻辑并提升整体性能。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

755

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

636

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

707

2023.08.11

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.7万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号