首先启用PL/Python3U扩展,再用CREATE OR REPLACE FUNCTION编写函数,支持复杂数据处理与数据库交互,但需注意性能开销和安全限制。

在 PostgreSQL 中使用 Python 编写存储函数,可以通过 PL/Python 扩展实现。PL/Python 允许你在数据库中直接用 Python 语言编写函数,适用于数据处理、复杂逻辑或与外部库集成的场景。下面介绍如何启用和编写 PL/Python 函数,并提供一些实用技巧。
启用 PL/Python 扩展
PostgreSQL 默认不加载 PL/Python,需手动安装。根据你使用的 Python 版本,选择对应的扩展:
- PL/Python3U(推荐):支持 Python 3,带 Unicode 支持。执行以下命令启用:
CREATE EXTENSION IF NOT EXISTS plpython3u;
- 确保服务器已安装 Python 3 开发包,且 PostgreSQL 编译时启用了对 Python 的支持。
编写简单的 PL/Python 函数
使用 CREATE OR REPLACE FUNCTION 定义一个 Python 函数,指定语言为 plpython3u。
立即学习“Python免费学习笔记(深入)”;
示例:计算两个数的和
CREATE OR REPLACE FUNCTION py_add(a integer, b integer)
RETURNS integer AS $$
return a + b
$$ LANGUAGE plpython3u;
调用方式:
SELECT py_add(3, 5); -- 返回 8
处理复杂数据类型
PL/Python 可以操作数组、记录、JSON 等类型。
示例:接收数组并返回最大值
CREATE OR REPLACE FUNCTION py_max(arr integer[])
RETURNS integer AS $$
if not arr:
return None
return max(arr)
$$ LANGUAGE plpython3u;
调用:
SELECT py_max(ARRAY[1,5,3,9,2]); -- 返回 9
示例:返回多行结果(SETOF)
CREATE OR REPLACE FUNCTION py_series(n integer)
RETURNS SETOF integer AS $$
for i in range(1, n+1):
yield i
$$ LANGUAGE plpython3u;
调用:
SELECT * FROM py_series(5);
访问数据库和异常处理
PL/Python 提供了 plpy 模块,用于执行 SQL 查询和日志输出。
示例:查询用户表并返回用户名列表
CREATE OR REPLACE FUNCTION get_user_names()
RETURNS SETOF text AS $$
plan = plpy.prepare("SELECT name FROM users WHERE active = true")
result = plpy.execute(plan)
for row in result:
yield row['name']
$$ LANGUAGE plpython3u;
异常处理建议:
- 使用 try-except 防止函数崩溃
- 通过 plpy.notice() 或 plpy.error() 输出日志
try:
res = plpy.execute("SELECT * FROM some_table", 10)
except Exception as e:
plpy.error("查询失败: " + str(e))
性能与安全注意事项
虽然灵活,但 PL/Python 有其局限性:
- 性能开销:Python 解释器启动有一定成本,频繁调用小函数不如原生 SQL 高效。
- 权限控制:PL/Python 函数以数据库用户身份运行,避免执行系统命令(如 os.system)。
- 不可移植性:依赖数据库环境中的 Python 模块,部署时需确保一致性。
- 调试困难:使用 plpy.notice() 输出中间值辅助调试。
基本上就这些。合理使用 PL/Python 能极大增强 PostgreSQL 的表达能力,尤其适合文本处理、数学计算或调用内置算法的场景。关键是控制好边界,不替代本可用 SQL 高效完成的任务。











