bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

冷炫風刃

发布时间：2026-01-25 08:00:02

772人浏览过

来源于php中文网

原创

bytearray可原地修改且复用内存，bytes不可修改；操作时应预估大小、用extend()拼接、注意传参副作用及转换开销。

bytearray vs bytes 的可变性导致的常见内存拷贝陷阱

修改 `bytearray` 不会触发新对象分配，`bytes` 一改就报错

这是最直接的差异：你不能对 bytes 做任何原地修改——哪怕只是改一个字节，Python 就立刻抛 TypeError: 'bytes' object does not support item assignment。而 bytearray 允许 ba[0] = 65、ba.append(98)、del ba[-1] 这类操作，全程复用同一块内存地址。

实操建议：

用 id() 对比验证：id(ba) 在多次修改后不变；id(b) 和 id(b.replace(...)) 一定不同
别用 bytes 接收网络流或文件缓冲区后再“加工”——它强制你每次操作都拷贝整段数据
如果只是读取+解码（如 b'hello'.decode()），bytes 更轻量；但凡要拼接、截断、填充、加校验位，优先选 bytearray

`bytearray` 拼接时用 `extend()`，别用 `+=` 或 `+`

+= 看似是原地操作，但在 bytearray 上它其实等价于 __iadd__，底层仍可能触发隐式拷贝（尤其当预留空间不足时）。而 extend() 明确走扩容+复制路径，行为更可控。

常见错误现象：

循环中反复 ba += b'\x00' → 内存分配次数随长度线性增长，性能暴跌
用 ba = ba + other_ba → 创建全新 bytearray，旧对象被丢弃，GC 压力增大

正确做法：

初始化时预估大小：ba = bytearray(4096)，再用 ba[:n] = ... 填充
拼接多个片段用 ba.extend(other)，支持 bytes、bytearray、list（元素为 0–255 整数）
确认是否真需要拼接：有时用 memoryview(ba) 切片访问，比复制更省

传参时小心“假装可变”的陷阱：函数内 `bytearray` 修改会反映到调用方

因为 bytearray 是可变对象，传入函数后，你在函数里 ba.append() 或 ba[0] = 1，调用方看到的就是被改过的原对象——不像 bytes 那样天然隔离。

Programming Helper

AI代码自动生成器，在AI的帮助下更快地编程

下载

容易踩的坑：

写工具函数时没加防御性拷贝：def encrypt_inplace(data): data[:] = ... → 调用者原始数据被意外覆盖
多线程/协程共享同一个 bytearray 缓冲区 → 竞态修改导致数据错乱（它不是线程安全的）
误以为 ba.copy() 是深拷贝 —— 实际只是浅拷贝（新对象，但内容独立），这点比 list.copy() 更易混淆

建议：

函数文档明确标注是否修改入参
不确定时，开头加 if not isinstance(data, bytearray): data = bytearray(data) 或 data = data.copy()
高并发场景下，用 threading.local() 绑定私有缓冲区，别复用全局 bytearray

从 `bytes` 创建 `bytearray` 的开销不可忽略

看似只是一次转换：ba = bytearray(b)，但背后是完整内存拷贝——哪怕 b 有 10MB，这一步就要额外分配 10MB 并逐字节复制。

性能影响明显的情况：

高频小包处理（如 WebSocket 帧解析），每次收包都 bytearray(recv_bytes) → CPU 和内存带宽成瓶颈
用 bytes 作缓存键（如 cache[b]），又频繁转成 bytearray 修改 → 双重浪费

优化方向：

源头控制：让 I/O 层直接返回 bytearray（如 socket.recv_into(bytearray)）
避免无谓转换：能用 memoryview(b) 切片访问的，就不转 bytearray
批量处理时，先收集所有 bytes 片段，再一次性构造大 bytearray，而非逐个转

真正麻烦的不是“能不能改”，而是“谁在什么时候悄悄改了”。bytearray 的可变性像一把没鞘的刀——用得好省资源，握得松就割手。尤其在底层协议解析、二进制打包、零拷贝优化这些地方，多看一眼 id() 和内存占用曲线，比背十遍文档管用。

Python asyncio.sleep怎么用_模拟异步非阻塞耗时操作切出控制权替代time.sleep()

Python多数元素怎么找_摩尔投票法O(1)空间寻找众数

Python爬虫重试机制怎么写_Tenacity库装饰器实现网络异常自动重试与退避策略

Python异步上下文管理器_async with使用与__aenter__及__aexit__魔法方法实现资源管理

Python断言怎么写_assert语句在代码调试与校验中的作用

相关标签:

python 字节 websocket 工具内存占用 Object if 循环线程多线程切片 append copy 并发对象 websocket

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python asyncio.wait() 和 asyncio.as_completed() 实际使用差异下一篇：如何在 PySpark 中安全拼接包含 NULL 值的数组列（如 array）

作者最新文章

SQL报表时间维度统计慢_时间索引优化

2026-03-11 11:53

SQL ShardingSphere 的 binding table 与 join 路由优化实践

2026-03-11 12:16

Linux磁盘空间不足排查_磁盘占用分析方法

2026-03-11 12:53

Linux高并发优化方案_系统参数综合调优

2026-03-11 13:01

PHP 数据库主从复制原理解析

2026-03-11 14:02

Linux磁盘快照使用_快照备份与回滚实践

2026-03-11 14:08

Linux运维稳定性建设_高可用运维思路

2026-03-11 14:16

SQL 定时事件 EVENT 创建与管理优化技巧

2026-03-11 14:53

SQL日志刷盘慢问题_redo与binlog优化

2026-03-11 15:21

SQL查询缓存设计_查询结果缓存策略

2026-03-11 15:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

847

2023.08.22

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧，包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例，帮助学习者掌握如何构建高性能、多任务并发的 Python 应用。

377

2025.12.24

java多线程相关教程合集

本专题整合了java多线程相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.21

C++多线程相关合集

本专题整合了C++多线程相关教程，阅读专题下面的的文章了解更多详细内容。

2026.01.21

C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧，包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目，帮助开发者掌握如何在 C# 中构建高并发、低延迟的异步系统，提升应用性能和响应速度。

103

2026.02.06

go语言数组和切片

本专题整合了go语言数组和切片的区别与含义，阅读专题下面的文章了解更多详细内容。

2025.09.03

append用法

append是一个常用的命令行工具，用于将一个文件的内容追加到另一个文件的末尾。想了解更多append用法相关内容，可以阅读本专题下面的文章。

349

2023.10.25

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板