CFFI处理嵌套结构与void指针的内存管理教程

DDD

发布时间：2025-11-08 12:05:27

327人浏览过

来源于php中文网

原创

CFFI处理嵌套结构与void指针的内存管理教程

本教程深入探讨了使用python cffi库与c代码交互时，处理包含多层`void*`指针的嵌套结构体所面临的内存管理挑战。文章揭示了c函数返回局部变量地址导致内存损坏的常见问题，并提供了通过在python端使用`ffi.new`机制安全分配和管理c结构体内存的解决方案，确保数据在python和c之间传递时的有效性。

1. 引言：CFFI与复杂C数据结构的交互挑战

Python的cffi库为Python与C语言代码的高效互操作提供了强大支持，尤其在处理现有C库时，其ABI模式（Application Binary Interface）无需修改C源代码即可集成。然而，当C数据结构涉及嵌套结构体和void*指针时，内存管理成为一个关键挑战。不当的内存处理可能导致在Python和C之间传递数据时出现内存损坏，表现为段错误（Segmentation Fault）或不可预测的行为。

本教程将通过一个具体的案例，详细分析在使用cffi传递包含多层void*指针的嵌套C结构体时遇到的内存问题，并提供一套健壮的解决方案。

2. 问题场景：嵌套void*结构体的内存失效

考虑以下C语言定义的嵌套结构体：

test.h

typedef enum State {
    state_1 = 0,
    state_2,
    state_3,
    state_4
} state_t;

typedef struct buffer {
    char* name;
    state_t state;
    void* next; // 指向下一个结构体的void指针
} buffer_t;

typedef struct buffer_next {
    char* name;
    state_t state;
    void* next; // 指向下一个结构体的void指针
} buffer_next_t;

typedef struct buffer_next_next {
    char* name;
    state_t state;
    void* next; // 最终层，可指向NULL或特定数据
} buffer_next_next_t;

extern buffer_t createBuffer();
extern int accessBuffer(buffer_t buffer);

以及相应的C实现，其中createBuffer函数在栈上创建这些结构体实例，并将其地址赋给next指针：

test.c

#include <stdio.h> // for printf

// ... (typedefs from test.h) ...

buffer_t createBuffer(){
    buffer_next_next_t bufferNN; // 栈上分配
    buffer_next_t bufferN;       // 栈上分配
    buffer_t buffer;             // 栈上分配

    bufferNN.name = "buffer_next_next";
    bufferNN.state = 3;
    bufferNN.next = NULL; // 最后一层，此处示例设为NULL

    bufferN.name = "buffer_next";
    bufferN.state = 2;
    bufferN.next = &bufferNN; // 指向栈上的bufferNN

    buffer.name = "buffer";
    buffer.state = 1;
    buffer.next = &bufferN;   // 指向栈上的bufferN

    // 在C函数内部调用accessBuffer是安全的，因为bufferN和bufferNN仍在作用域内
    // accessBuffer(buffer); 
    // 此处注释掉，因为我们主要关注Python调用后的行为

    return buffer; // 返回buffer_t的副本
}

int accessBuffer(buffer_t buffer){
    // 将void*指针强制转换为具体类型并访问
    buffer_next_t *buffer_next = (buffer_next_t*)buffer.next;

    // 检查指针有效性以避免空指针解引用
    if (!buffer_next) {
        fprintf(stderr, "Error: buffer.next is NULL\n");
        return -1;
    }

    buffer_next_next_t *buffer_next_next = (buffer_next_next_t*)buffer_next->next;

    if (!buffer_next_next) {
        fprintf(stderr, "Error: buffer_next->next is NULL\n");
        return -1;
    }

    printf("%s, %s, %s\n", buffer.name, buffer_next->name, buffer_next_next->name);

    return 0;
}

Python端通过cffi加载并调用这些函数：

test.py (原始问题代码)

import os
import subprocess
from cffi import FFI

ffi = FFI()

here = os.path.abspath(os.path.dirname(__file__))
header = os.path.join(here, 'test.h')

# 使用cc -E预处理头文件以获取cdef所需的完整定义
ffi.cdef(subprocess.Popen([
    'cc', '-E',
    header], stdout=subprocess.PIPE).communicate()[0].decode('UTF-8'))
lib = ffi.dlopen(os.path.join(here, 'test.so'))

value = lib.createBuffer() # 从C获取buffer_t
print(value)
lib.accessBuffer(value)    # 将其传回C

当运行上述Python代码时，lib.accessBuffer(value) 调用通常会导致段错误。通过GDB调试，可以发现当value从Python传回C的accessBuffer函数时，其内部的next指针指向的内存内容已经损坏或无效。这是因为createBuffer函数中bufferN和bufferNN是在函数栈上分配的局部变量。当createBuffer函数返回时，这些局部变量的生命周期结束，它们所占据的内存可能被操作系统回收或重用。因此，buffer.next和buffer_next->next所指向的地址变得无效，导致后续访问野指针引发段错误。

3. 解决方案：在Python中管理C结构体的内存

解决此问题的关键在于确保所有嵌套结构体的内存生命周期都由Python控制，并且在需要时可以安全地传递给C函数。cffi提供了ffi.new()函数，用于在C的堆上分配内存，并由cffi的垃圾回收机制管理，从而保证了这些内存的有效性，直到相应的Python cdata对象被回收。

以下是使用ffi.new()在Python中创建并管理这些嵌套结构体的正确方法：

ImgGood

免费在线AI照片编辑器

下载

test.py (修正后的解决方案)

import os
import subprocess
from cffi import FFI

ffi = FFI()

here = os.path.abspath(os.path.dirname(__file__))
header = os.path.join(here, 'test.h')

# 使用cc -E预处理头文件以获取cdef所需的完整定义
ffi.cdef(subprocess.Popen([
    'cc', '-E',
    header], stdout=subprocess.PIPE).communicate()[0].decode('UTF-8'))
lib = ffi.dlopen(os.path.join(here, 'test.so'))

# 1. 在Python中为字符串分配C内存
# ffi.new("char[SIZE]", b"string") 用于创建C字符串，确保其在C堆上
char_name_nn = ffi.new("char[20]", b"buffer_next_next")
char_name_n = ffi.new("char[20]", b"buffer_next")
char_name = ffi.new("char[20]", b"buffer")

# 2. 在Python中为嵌套结构体分配C内存
# ffi.new("TYPE *") 会在C堆上分配一个TYPE类型的实例，并返回一个指向它的cdata指针
bufferNN_py = ffi.new("buffer_next_next_t *")
bufferNN_py.name = char_name_nn
bufferNN_py.state = 3
bufferNN_py.next = ffi.NULL # 最后一层指针设为NULL

bufferN_py = ffi.new("buffer_next_t *")
bufferN_py.name = char_name_n
bufferN_py.state = 2
bufferN_py.next = bufferNN_py # 将上一层结构体的指针赋给当前层的next

buffer_py = ffi.new("buffer_t *")
buffer_py.name = char_name
buffer_py.state = 1
buffer_py.next = bufferN_py # 将上一层结构体的指针赋给当前层的next

# 3. 调用C函数
# 注意：如果C函数期望接收一个结构体实例（by value），
# 需要使用指针解引用 buffer_py[0] 将cdata指针转换为cdata结构体实例
# 如果C函数期望接收结构体指针，则直接传递 buffer_py
lib.accessBuffer(buffer_py[0]) 

# 原始问题中尝试从C创建并返回buffer_t，这里保留其调用以对比
# value_from_c = lib.createBuffer()
# print(value_from_c)
# lib.accessBuffer(value_from_c) # 再次调用此处仍会失败，因为value_from_c内部指针无效

编译C代码：

gcc -shared -fPIC test.c -o test.so

运行修正后的Python代码，将得到预期输出：

buffer, buffer_next, buffer_next_next

通过GDB调试，可以确认此时accessBuffer函数接收到的buffer结构体内部的name和next指针都指向了有效的、由Python管理的C堆内存，从而避免了内存损坏。

4. 关键点与最佳实践

内存所有权与生命周期：
- 当C函数返回局部变量的地址（无论是直接返回指针还是作为结构体成员）时，这些指针在函数返回后将立即失效。Python cffi接收到这样的结构体后，其内部指针将成为野指针。
- 对于需要在Python和C之间长期共享或传递的复杂数据结构，应始终在Python端使用ffi.new()在C堆上分配内存。cffi会为这些分配的内存创建Python cdata对象，并负责其生命周期管理。
ffi.new() 的使用：
- ffi.new("type *")：用于在C堆上分配一个type类型的实例，并返回一个指向该实例的cdata指针。这是创建复杂结构体（如本例中的buffer_t *）的首选方法。
- ffi.new("char[SIZE]", b"string")：用于为C字符串分配内存并初始化。Python字符串是不可变的，直接传递给C的char*可能导致问题。使用此方法可以确保C字符串拥有独立的、可修改的C堆内存。
指针传递与值传递：
- 当C函数参数为struct_t buffer（按值传递）时，Python调用时应传递cdata结构体实例，例如buffer_py[0]。
- 当C函数参数为struct_t *buffer_ptr（按指针传递）时，Python调用时应直接传递cdata指针，例如buffer_py。
- 确保类型匹配是避免潜在错误的关键。
调试技巧：
- 使用GDB等调试工具是诊断内存相关问题的有效方法。通过在C函数入口设置断点，检查传入参数的内存地址和内容，可以迅速定位问题所在。

5. 总结

在Python中使用cffi与C语言进行交互时，尤其涉及到包含void*指针的嵌套结构体，对内存生命周期的理解至关重要。核心原则是：如果C函数返回的指针指向其内部的局部变量，则该指针在函数返回后无效。对于需要在Python中创建并传递给C函数的数据结构，应始终在Python端使用ffi.new()在C堆上分配内存，并由cffi管理其生命周期。遵循这一原则，可以有效避免内存损坏，确保Python和C代码之间的稳定和正确交互。

Python Web开发用哪个框架_Django/Flask/FastAPI优缺点对比

Python如何打包环境_项目代码与运行环境一键迁移方案

Python Flask怎么用Celery_将耗时发信处理等后台异步任务分发给消息队列与结果查询

Python全局解释器锁是什么_GIL对多线程运行效率的影响解析

Python ASGI是什么_异步Web服务器协议与Uvicorn部署

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Jupyter Notebook中模块状态隔离与logging配置重置实践下一篇：Pandas DataFrame中字符串元素的首尾替换技巧

作者最新文章

UDP 数据丢失排查指南：发送端缓冲区与接收端缓冲区协同调优

2026-03-14 14:15

Laravel Eloquent 关联属性访问错误的正确解决方案

2026-03-14 14:16

RayLink怎么设置会话水印

2026-03-14 14:16

Go 中 JSON 解析失败的常见原因：结构体字段未导出

2026-03-14 14:17

Android步数计数器重置失效的根源与持久化修复方案

2026-03-14 14:17

Go 中使用通道协调多协程数据操作的正确实践

2026-03-14 14:17

如何在 JavaScript 中动态访问对象属性并正确使用 filter 方法

2026-03-14 14:18

和平营地如何申请体验服资格

2026-03-14 14:19

如何在 Laravel 中对 JSONB 字段中的多个键值高效求和

2026-03-14 14:20

微信朋友圈不压缩视频画质的方法

2026-03-14 14:20

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

C语言变量命名

c语言变量名规则是：1、变量名以英文字母开头；2、变量名中的字母是区分大小写的；3、变量名不能是关键字；4、变量名中不能包含空格、标点符号和类型说明符。php中文网还提供c语言变量的相关下载、相关课程等内容，供大家免费下载使用。

410

2023.06.20

c语言入门自学零基础

C语言是当代人学习及生活中的必备基础知识，应用十分广泛，本专题为大家c语言入门自学零基础的相关文章，以及相关课程，感兴趣的朋友千万不要错过了。

638

2023.07.25

c语言运算符的优先级顺序

c语言运算符的优先级顺序是括号运算符 > 一元运算符 > 算术运算符 > 移位运算符 > 关系运算符 > 位运算符 > 逻辑运算符 > 赋值运算符 > 逗号运算符。本专题为大家提供c语言运算符相关的各种文章、以及下载和课程。

362

2023.08.02

c语言数据结构

数据结构是指将数据按照一定的方式组织和存储的方法。它是计算机科学中的重要概念，用来描述和解决实际问题中的数据组织和处理问题。数据结构可以分为线性结构和非线性结构。线性结构包括数组、链表、堆栈和队列等，而非线性结构包括树和图等。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

263

2023.08.09

c语言random函数用法

c语言random函数用法：1、random.random，随机生成（0,1）之间的浮点数；2、random.randint，随机生成在范围之内的整数，两个参数分别表示上限和下限；3、random.randrange，在指定范围内，按指定基数递增的集合中获得一个随机数；4、random.choice，从序列中随机抽选一个数；5、random.shuffle，随机排序。

632

2023.09.05

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

564

2023.09.20