Python文本模式下seek()仅允许seek(0)或seek(f.tell()),因需处理换行符转换、Unicode多字节编码等;二进制模式才支持任意字节偏移定位,tell()返回真实字节位置。

Python 中 seek() 和 tell() 在文本模式下行为受限,尤其在换行符、Unicode 编码和跨平台场景中容易出错;真正可自由定位的只有二进制模式。
文本模式下 seek() 只允许回到 tell() 返回的位置或文件开头
在以 'r'、'w+' 等文本模式打开文件时,seek() 的偏移量必须是之前 tell() 返回的值,或 0(即 seek(0))。其他任意整数(比如 seek(5))会触发 io.UnsupportedOperation: can't do nonzero end-relative seeks 或类似错误。
这是因为文本模式要处理换行符标准化(\r\n → \n)、字符编码(如 UTF-8 多字节字符)、以及缓冲区对齐等问题,Python 无法保证中间某个字节偏移对应合法的字符边界。
- ✅ 允许:
f.seek(0)、f.seek(f.tell()) - ❌ 禁止:
f.seek(10)、f.seek(-5, 2)(除非刚调用过tell())
二进制模式才是 seek/tell 的“完全体”
用 'rb'、'wb+' 打开文件后,seek() 支持任意合法偏移(包括负值、相对末尾等),tell() 返回的是真实的字节位置,无编码干扰。
立即学习“Python免费学习笔记(深入)”;
例如读取 UTF-8 文件某一段:先用二进制模式定位,再按需解码局部字节:
with open('data.txt', 'rb') as f:
f.seek(100) # 跳到第 100 字节
chunk = f.read(50) # 读 50 字节
text = chunk.decode('utf-8', errors='ignore') # 容错解码注意:直接对非字符边界截断可能导致解码失败(如截断一个多字节 UTF-8 字符),需配合 errors= 参数或手动校准。
tell() 的返回值在不同模式下含义不同
tell() 总是返回一个整数,但语义取决于打开模式:
- 文本模式:
tell()返回的是“不透明标记”,仅可用于后续seek()回退,不可解释为字节数或字符数; - 二进制模式:
tell()返回当前文件指针的字节偏移量,可参与计算、保存、比较; - 追加模式(
'a'或'ab')下,即使调用seek(),写操作仍强制发生在文件末尾(POSIX 行为),tell()可能显示中间位置,但write()不会覆盖。
跨平台换行符会让文本模式 seek 更难预测
Windows 默认用 \r\n,Unix 用 \n。文本模式下,Python 会把所有 \r\n 当作单个 \n 处理,但底层存储仍是两个字节。这就导致:
-
tell()返回的“位置”不等于实际字节数; - 同一段文本,在 Windows 和 Linux 上用文本模式
tell()可能得到不同数值; - 想精确定位某行某列?必须用二进制模式 + 自行解析换行符和编码。
例如统计第 3 行起始字节位置:逐行读二进制流并累加 len(line)(含原始换行符),比依赖文本模式 seek() 可靠得多。










