memoryview.cast() 仅在底层缓冲区字节存储、目标 dtype 元素大小整除总字节数且对齐无冲突时实现零拷贝;bytes 仅支持 cast('B'),array.array 和 bytearray 在长度匹配前提下可安全转换,numpy.ndarray 支持更灵活的 reinterpret_cast。

memoryview.cast() 能否真正零拷贝转换 dtype?
不能一概而论。只有当源 memoryview 的底层缓冲区(如 bytes、bytearray、array.array 或支持 __array_interface__ 的对象)本身以字节为单位存储,且目标 dtype 的元素大小能整除原缓冲区总字节数、对齐无冲突时,cast() 才是纯零拷贝——它只是重新解释已有内存的视图,不复制数据。
常见误区是以为 cast('f') 能把 bytes 直接变成浮点数组;实际必须确保原始数据本身就是按 IEEE 754 布局的 4 字节/8 字节块,否则结果未定义(不是报错,而是读出垃圾值)。
哪些类型支持安全 cast 到不同 dtype?
核心限制在缓冲区协议是否暴露 format 和 itemsize,且底层内存布局兼容:
-
array.array('B')(无符号字节)可cast('i')(转为 32 位有符号整数),前提是长度是 4 的倍数 -
bytearray可cast('H')(16 位无符号短整型),但需注意字节序:默认按系统本地序,cast('H')和cast('>H')行为不同 -
numpy.ndarray的memoryview通常支持更灵活的cast(),因其format字符严格对应 C 类型(如'f'对应float32),但前提是原数组dtype是可 reinterpret 的(例如uint8→int16),而非需要数值转换(如float32→int32) -
bytes仅支持 cast 到'B'(即自身),其他任何cast()都会抛TypeError: memoryview: invalid type for format 'f'
cast() 的 format 字符怎么选?
cast() 的参数是 PEP 3118 格式字符串,不是 NumPy 的 dtype 字符串。二者不等价:
-
'b'= 有符号字节(int8),'B'= 无符号字节(uint8) -
'h'= 有符号 short(16 位),'i'= 有符号 int(通常 32 位),'f'= C float(32 位),'d'= C double(64 位) - 带前缀可指定字节序:
'>f'(大端 float),(小端 float),(本机序,缺省) - 不支持
'f4'、'这类 NumPy 风格写法;用错会直接报 ValueError: memoryview: invalid cast to format 'f4'
为什么 cast() 后修改会影响原对象?
因为它是真正的共享内存视图:
ba = bytearray(b'\x01\x00\x00\x00')
mv = memoryview(ba)
iv = mv.cast('i') # 假设小端系统
iv[0] = 42
# 此时 ba == bytearray(b'*\x00\x00\x00') —— 原始字节已被改写
这个特性既是优势也是风险:适合高性能原地处理,但若误用(比如 cast 后写入越界或格式不匹配),会静默破坏原始数据。尤其注意 cast() 不做边界检查——iv[1] 访问可能已超出 ba 实际长度,触发 IndexError 或读到非法内存(取决于运行时环境)。
最易被忽略的是字节序和平台依赖性:同一段代码在 x86(小端)和 ARM64(可能大端)上 cast('i') 结果完全不同,且不会报错。若需跨平台确定行为,必须显式指定字节序字符(如 ' 或 '>i'),并验证底层缓冲区是否真的按该序排列。










