swaplevel()仅交换multiindex中两个指定层级位置,不增删层或重排全部层级;reorder_levels()才支持按列表顺序重排所有层级;交换后需sort_index()确保索引有序,且仅适用于multiindex。

swaplevel() 只交换两个级别,不改变层级总数
swaplevel() 的作用非常具体:它只对多层索引(MultiIndex)中**相邻或指定的两个层级**做位置互换,其余层级顺序不变。它不会删层、不会增层,也不会重排全部层级——想把第 0 层和第 2 层直接对调?不行,得先 swap 一次再 swap 一次。
常见错误现象:df.swaplevel(0, 2) 报错 IndexError: Too many levels: Index has only 2 levels, not 3,其实是因为你传了超出当前层级数的数字;或者误以为它能“移动”某一层到任意位置,结果发现只换了两个。
- 参数
i和j必须是整数,且绝对值不能超过len(index.names) - 1 - 默认行为是
swaplevel(-2, -1),即交换最后两层(最内层和次内层) - 对
DataFrame调用时,默认操作行索引;加axis=1才操作列索引 - 返回新对象,原
index不变,需用inplace=True或重新赋值
reorder_levels() 才是真正按需排列所有层级
如果你的目标是把多层索引变成「年-月-地区」或「地区-年-月」这种固定顺序,reorder_levels() 是唯一干净解法。它接受一个列表,明确指定每个位置该放哪一层级(按名称或序号),一步到位。
使用场景:读取 HDF5/Parquet 时索引顺序混乱;聚合后层级被自动移到末尾;想统一导出前的索引结构。
- 参数可以是名字列表,如
['region', 'year', 'month'],前提是所有名都存在且不重复 - 也可以是序号列表,如
[2, 0, 1],表示“把原第 2 层放到第 0 位,原第 0 层放到第 1 位……” - 层级名有重复?会报
KeyError,此时只能用序号 - 性能上无明显差异,但语义更清晰,不易误用
示例:df.index = df.index.reorder_levels(['country', 'category'])
swaplevel() 后常要 sort_index(),否则切片失效
交换层级后,索引不再保证字典序,.xs()、.loc[('A', )] 或布尔切片可能漏数据或报 KeyError,因为底层结构没排序。
错误现象:执行 df.swaplevel(0, 1) 后,df.loc['2023'] 报错,但 df.index.get_level_values(0).unique() 明明有 '2023'。
- 根本原因:Pandas 对多层索引的快速查找依赖于层级有序性,swap 不触发重排序
- 必须显式跟一句
df.sort_index()(默认按所有层升序) - 如果只关心某一层排序,可用
sort_index(level=0),但多数情况建议全排 - 注意:sort_index() 返回新对象,同样要赋值或设
inplace=True
重排列前先确认 index 类型,避免 AttributeError
不是所有 DataFrame 都有 MultiIndex。swaplevel() 和 reorder_levels() 只适用于 MultiIndex,普通单层 Index 调用会直接抛 AttributeError: 'Index' object has no attribute 'swaplevel'。
容易踩的坑:从 CSV 读入后手动设置了 set_index(['a', 'b']),但其中一列全是 NaN,导致 Pandas 自动降级为单层索引;或者用了 reset_index().set_index(...) 中间断开过层级结构。
- 检查方式:
isinstance(df.index, pd.MultiIndex) - 安全写法:先
if hasattr(df.index, 'swaplevel'):再调用 - 调试时打印
df.index.names和type(df.index)比猜更可靠
复杂点在于:层级结构可能在链式操作中悄然瓦解,而错误直到下游调用才暴露。盯住每一步的 df.index 类型,比事后查 swaplevel 语法更重要。









