0

0

Python ctypes与C结构体数组的UDP通信及解析教程

霞舞

霞舞

发布时间:2025-11-18 12:55:22

|

484人浏览过

|

来源于php中文网

原创

python ctypes与c结构体数组的udp通信及解析教程

本教程旨在详细讲解如何在Python中使用`ctypes`库接收并解析通过UDP发送的C语言嵌套结构体数组数据。我们将探讨C语言侧的数据序列化方法,以及Python侧使用`ctypes`进行复杂结构体数据反序列化的正确姿势,并提供一种更简洁的纯Python `struct` 模块实现方案,以提高数据处理效率和代码可读性

1. 引言:C/C++与Python的数据交互挑战

在跨语言通信,特别是C/C++与Python之间进行数据交换时,经常需要处理复杂的数据结构。当这些结构体包含嵌套结构体或动态数组(通过指针表示)时,通过网络(如UDP)传输原始内存数据会遇到挑战。C语言中的指针在序列化时,其值(内存地址)本身并无意义,我们需要发送的是指针所指向的实际数据内容。本教程将以一个包含嵌套结构体数组的C结构体为例,演示如何在Python中正确接收和解析此类数据。

2. C/C++端数据序列化

原始的C代码尝试通过memcpy(&testStruct, buffer, sizeof(MyStruct))直接复制结构体内存来发送数据。然而,当结构体中包含指针(如MyInnerStruct *InnerStruct)时,memcpy只会复制指针变量本身的值(即一个内存地址),而不会复制指针所指向的实际数组内容。这导致Python端接收到的指针值是无效的,无法正确访问数组数据。

正确的C端序列化方法是,将结构体的所有基本类型字段以及指针所指向的数组元素逐一写入一个字节缓冲区。

立即学习Python免费学习笔记(深入)”;

C/C++结构体定义:

#include <iostream>
#include <vector>
#include <cstring> // For memcpy
#include <winsock2.h> // For network operations (optional for serialization logic)

// 禁用一些警告,实际项目中应谨慎处理
#define _WINSOCK_DEPRECATED_NO_WARNINGS
#define _CRT_SECURE_NO_WARNINGS
#pragma comment(lib, "Ws2_32.lib")

struct MyInnerStruct {
    int intValue;
    float floatValue;
};

struct MyStruct {
    int intValue; // This field will also serve as the count of InnerStructs
    float floatValue;
    MyInnerStruct *InnerStruct; // Pointer to an array of MyInnerStruct
};

// 辅助函数:将MyStruct及其内部数组序列化为字节向量
std::vector<char> serializeMyStruct(const MyStruct& s, int innerStructCount) {
    std::vector<char> buffer;
    // 确保使用小端序(Little-endian)以匹配Python的'<if'格式
    // 实际项目中应考虑网络字节序或明确指定字节序

    // 序列化 MyStruct 的 intValue
    buffer.insert(buffer.end(), (char*)&s.intValue, (char*)&s.intValue + sizeof(s.intValue));
    // 序列化 MyStruct 的 floatValue
    buffer.insert(buffer.end(), (char*)&s.floatValue, (char*)&s.floatValue + sizeof(s.floatValue));

    // 序列化 MyInnerStruct 数组的每个元素
    for (int i = 0; i < innerStructCount; ++i) {
        buffer.insert(buffer.end(), (char*)&s.InnerStruct[i].intValue, (char*)&s.InnerStruct[i].intValue + sizeof(s.InnerStruct[i].intValue));
        buffer.insert(buffer.end(), (char*)&s.InnerStruct[i].floatValue, (char*)&s.InnerStruct[i].floatValue + sizeof(s.InnerStruct[i].floatValue));
    }
    return buffer;
}

int main() {
    // 1. 初始化数据
    MyStruct testStruct;
    testStruct.intValue = 4; // 设定内部数组的元素数量
    testStruct.floatValue = 3.5f;

    // 分配内部结构体数组
    int innerArrayCount = testStruct.intValue;
    testStruct.InnerStruct = new MyStruct::MyInnerStruct[innerArrayCount];

    for (int i = 0; i < innerArrayCount; ++i) {
        testStruct.InnerStruct[i].intValue = i + 1;
        testStruct.InnerStruct[i].floatValue = 1.25f + i * 1.25f / 2;
    }

    // 2. 序列化数据
    std::vector<char> serialized_data = serializeMyStruct(testStruct, innerArrayCount);

    // 3. UDP发送部分 (此处仅作示例,实际需完善错误处理)
    WSADATA wsaData;
    if (WSAStartup(MAKEWORD(2, 2), &wsaData) != 0) {
        std::cerr << "Failed to initialize winsock." << std::endl;
        return 1;
    }

    int udpSocket = socket(AF_INET, SOCK_DGRAM, 0);
    if (udpSocket == -1) {
        perror("Error creating socket");
        WSACleanup();
        return 1;
    }

    sockaddr_in serverAddr;
    serverAddr.sin_family = AF_INET;
    serverAddr.sin_port = htons(5000); // 目标端口
    serverAddr.sin_addr.s_addr = inet_addr("127.0.0.1"); // 目标IP

    if (sendto(udpSocket, serialized_data.data(), serialized_data.size(), 0,
               reinterpret_cast<sockaddr*>(&serverAddr), sizeof(serverAddr)) == -1) {
        perror("Error sending data");
        closesocket(udpSocket);
        WSACleanup();
        return 1;
    }

    std::cout << "Struct sent successfully. Data size: " << serialized_data.size() << " bytes." << std::endl;

    // 清理
    delete[] testStruct.InnerStruct;
    closesocket(udpSocket);
    WSACleanup();
    return 0;
}

关键点:

  • serializeMyStruct函数负责将MyStruct的字段和MyInnerStruct数组的每个元素逐个复制到std::vector<char>缓冲区中。
  • testStruct.intValue被用作MyInnerStruct数组的元素数量,这是一种常见的将数组长度与结构体一同传输的方式。
  • 字节序(Endianness)非常重要。C++端需要与Python端(struct.pack或struct.unpack的格式字符串)保持一致。本例中,Python使用<表示小端序,C++代码隐式地以系统默认字节序复制,因此在小端序系统上可以匹配。跨平台或不同系统间通信时,推荐使用htons/htonl等函数进行网络字节序转换。

3. Python端接收与解析(ctypes方法)

Python的ctypes库允许我们定义与C语言结构体对应的Python类,并直接操作内存。然而,对于从网络接收到的原始字节流,我们不能直接将其强制转换为包含指针的ctypes结构体。因为字节流中的“指针”不再是有效的内存地址,而是序列化时混入的数据。

Insou AI
Insou AI

Insou AI 是一款强大的人工智能助手,旨在帮助你轻松创建引人入胜的内容和令人印象深刻的演示。

下载

正确的做法是:

  1. 首先使用struct模块解析出顶层结构体的基本字段(特别是数组长度)。
  2. 根据数组长度,动态创建ctypes数组。
  3. 迭代地从字节流中解析出数组的每个元素,并填充到ctypes数组中。
  4. 将填充好的ctypes数组的引用赋值给顶层ctypes结构体中的指针字段。

Python ctypes接收端代码:

import socket
import struct
import ctypes as ct

# 定义与C语言对应的内部结构体
class MyInnerStruct(ct.Structure):
    _fields_ = (('field4', ct.c_int),
                ('field5', ct.c_float))

    def __repr__(self):  # 用于方便打印显示
        return f'({self.field4}, {self.field5})'

# 定义与C语言对应的外部结构体
class MyStruct(ct.Structure):
    _fields_ = (('field1', ct.c_int),
                ('field2', ct.c_float),
                ('field3', ct.POINTER(MyInnerStruct))) # 指向内部结构体数组的指针

    def __repr__(self):  # 用于方便打印显示
        # 访问field3时,需要确保它已被正确赋值为一个数组
        if self.field3:
            # 使用切片[:self.field1]来获取实际的数组元素,self.field1是数组长度
            return f'[{self.field1}, {self.field2}, {list(self.field3[:self.field1])}]'
        else:
            return f'[{self.field1}, {self.field2}, (null_pointer)]'

# UDP socket设置
HOST = '' # 监听所有可用接口
PORT = 5000

sock = socket.socket(type=socket.SOCK_DGRAM)
sock.bind((HOST, PORT))
print(f"Listening on UDP port {PORT}...")

try:
    while True:
        # 接收数据,假设最大数据包大小为40960字节
        data, addr = sock.recvfrom(40960)
        print(f"Received {len(data)} bytes from {addr}")

        # 1. 解包MyStruct的field1和field2
        # '<if' 表示小端序,一个int,一个float
        field1, field2 = struct.unpack_from('<if', data)

        # 创建MyStruct实例,此时field3(指针)仍为空
        received_struct = MyStruct(field1, field2)

        # 2. 根据field1(内部数组的元素数量)动态分配MyInnerStruct数组
        # MyInnerStruct * field1 创建一个包含 field1 个 MyInnerStruct 元素的数组类型
        inner_array_type = MyInnerStruct * field1
        inner_array = inner_array_type() # 实例化这个数组

        # 3. 计算内部结构体数据在缓冲区中的起始位置和每个元素的大小
        # MyStruct的前两个字段的大小
        start_of_inner = struct.calcsize('<if') 
        # MyInnerStruct 的大小
        size_of_inner_element = struct.calcsize('<if') 

        # 4. 迭代解包并填充内部数组
        current_index = start_of_inner
        for i in range(field1):
            # 从当前位置开始解包一个MyInnerStruct元素
            field4, field5 = struct.unpack_from('<if', data, current_index)
            inner_array[i] = MyInnerStruct(field4, field5) # 赋值给数组元素
            current_index += size_of_inner_element # 移动到下一个元素的位置

        # 5. 将填充好的内部数组赋值给MyStruct的field3指针
        received_struct.field3 = inner_array

        # 打印完整的接收结构体
        print("Received MyStruct:", received_struct)

except KeyboardInterrupt:
    print("Shutting down...")
finally:
    sock.close()

关键点:

  • struct.unpack_from('<if', data):用于从字节流中解析出MyStruct的前两个字段(field1和field2)。'<if'指定了小端序的整数和浮点数格式。
  • MyInnerStruct * field1:动态创建一个包含field1个MyInnerStruct元素的ctypes数组类型。
  • inner_array_type():实例化这个数组类型,得到一个实际的ctypes数组对象。
  • struct.calcsize('<if'):计算特定格式的字节大小,用于确定数据偏移量。
  • received_struct.field3 = inner_array:这是最关键的一步,将动态创建并填充好的ctypes数组赋值给MyStruct实例中的field3指针。ctypes会自动处理这种赋值,使得field3指向inner_array的内存。

4. Python端接收与解析(纯Python struct方法)

对于从网络接收的序列化数据,如果不需要将数据回传给C库或者进行内存层面的直接操作,使用纯Python类结合struct模块进行解析通常更简单、更高效,且避免了ctypes指针的复杂性。

这种方法的核心思想是:定义普通的Python类来表示C结构体,并为这些类添加from_data或from_data_array等工厂方法,负责从原始字节流中解析数据并创建Python对象。

Python struct接收端代码:

import socket
import struct

# 定义内部结构体的纯Python类
class MyInnerStruct:
    _format = '<if'  # 对应C语言中的 int 和 float,小端序
    _size = struct.calcsize(_format) # 计算每个MyInnerStruct元素的大小

    def __init__(self, f4, f5):
        self.field4 = f4
        self.field5 = f5

    @classmethod
    def from_data(cls, data_buffer, offset=0):
        """从字节缓冲区中解析单个MyInnerStruct"""
        f4, f5 = struct.unpack_from(cls._format, data_buffer, offset)
        return cls(f4, f5)

    @classmethod
    def from_data_array(cls, data_buffer, count, offset=0):
        """从字节缓冲区中解析MyInnerStruct数组"""
        inner_structs = []
        current_offset = offset
        for _ in range(count):
            inner_structs.append(cls.from_data(data_buffer, current_offset))
            current_offset += cls._size
        return inner_structs

    def __repr__(self):
        return f'[{self.field4}, {self.field5}]'

# 定义外部结构体的纯Python类
class MyStruct:
    _format = '<if'  # 对应C语言中的 int 和 float,小端序
    _size = struct.calcsize(_format) # 计算MyStruct前两个字段的大小

    def __init__(self, f1, f2, f3_array):
        self.field1 = f1
        self.field2 = f2
        self.field3 = f3_array # 此时field3直接是MyInnerStruct对象的列表

    @classmethod
    def from_data(cls, data_buffer):
        """从字节缓冲区中解析整个MyStruct,包括其内部数组"""
        # 首先解析MyStruct的field1和field2
        f1, f2 = struct.unpack_from(cls._format, data_buffer, 0)

        # 接着解析内部数组,从MyStruct字段之后开始
        inner_array_offset = cls._size
        f3_array = MyInnerStruct.from_data_array(data_buffer, f1, inner_array_offset)

        return cls(f1, f2, f3_array)

    def __repr__(self):
        return f'[{self.field1}, {self.field2}, {self.field3}]'

# UDP socket设置
HOST = '' # 监听所有可用接口
PORT = 5000

sock = socket.socket(type=socket.SOCK_DGRAM)
sock.bind((HOST, PORT))
print(f"Listening on UDP port {PORT}...")

try:
    while True:
        data, addr = sock.recvfrom(40960)
        print(f"Received {len(data)} bytes from {addr}")

        # 直接使用MyStruct的工厂方法从数据中

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C语言变量命名
C语言变量命名

c语言变量名规则是:1、变量名以英文字母开头;2、变量名中的字母是区分大小写的;3、变量名不能是关键字;4、变量名中不能包含空格、标点符号和类型说明符。php中文网还提供c语言变量的相关下载、相关课程等内容,供大家免费下载使用。

410

2023.06.20

c语言入门自学零基础
c语言入门自学零基础

C语言是当代人学习及生活中的必备基础知识,应用十分广泛,本专题为大家c语言入门自学零基础的相关文章,以及相关课程,感兴趣的朋友千万不要错过了。

638

2023.07.25

c语言运算符的优先级顺序
c语言运算符的优先级顺序

c语言运算符的优先级顺序是括号运算符 > 一元运算符 > 算术运算符 > 移位运算符 > 关系运算符 > 位运算符 > 逻辑运算符 > 赋值运算符 > 逗号运算符。本专题为大家提供c语言运算符相关的各种文章、以及下载和课程。

362

2023.08.02

c语言数据结构
c语言数据结构

数据结构是指将数据按照一定的方式组织和存储的方法。它是计算机科学中的重要概念,用来描述和解决实际问题中的数据组织和处理问题。数据结构可以分为线性结构和非线性结构。线性结构包括数组、链表、堆栈和队列等,而非线性结构包括树和图等。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

263

2023.08.09

c语言random函数用法
c语言random函数用法

c语言random函数用法:1、random.random,随机生成(0,1)之间的浮点数;2、random.randint,随机生成在范围之内的整数,两个参数分别表示上限和下限;3、random.randrange,在指定范围内,按指定基数递增的集合中获得一个随机数;4、random.choice,从序列中随机抽选一个数;5、random.shuffle,随机排序。

632

2023.09.05

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

564

2023.09.20

c语言get函数的用法
c语言get函数的用法

get函数是一个用于从输入流中获取字符的函数。可以从键盘、文件或其他输入设备中读取字符,并将其存储在指定的变量中。本文介绍了get函数的用法以及一些相关的注意事项。希望这篇文章能够帮助你更好地理解和使用get函数 。

671

2023.09.20

c数组初始化的方法
c数组初始化的方法

c语言数组初始化的方法有直接赋值法、不完全初始化法、省略数组长度法和二维数组初始化法。详细介绍:1、直接赋值法,这种方法可以直接将数组的值进行初始化;2、不完全初始化法,。这种方法可以在一定程度上节省内存空间;3、省略数组长度法,这种方法可以让编译器自动计算数组的长度;4、二维数组初始化法等等。

618

2023.09.22

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号