
Python 中自定义比较规则的核心在于控制排序时元素之间的大小判断逻辑,不依赖默认的 比较,而是通过函数或类明确告诉解释器“谁该排在前面”。关键不是重写比较操作符(除非用 <code>__lt__ 等魔术方法),而是用 key 参数或 functools.cmp_to_key 把原始数据映射为可比形式。
用 key 函数实现轻量级自定义排序
key 是最常用、最推荐的方式。它不改变原数据,只提供一个“提取/转换”的规则,让 sort 或 sorted 按照这个规则的返回值来排序。
- 对字典列表按某个字段排序:
students = [{'name': 'Alice', 'score': 85}, {'name': 'Bob', 'score': 92}]<br>students.sort(key=lambda x: x['score'], reverse=True) - 忽略大小写排序字符串:
names = ['Charlie', 'alice', 'Bob']<br>sorted(names, key=str.lower)
- 多级排序(先按年龄升序,再按姓名降序):
people = [('Alice', 30), ('Bob', 25), ('Charlie', 30)]<br>sorted(people, key=lambda x: (x[1], -ord(x[0][0]))) # 简单示例;更稳妥可用 str.lower 配合 tuple
用 cmp_to_key 处理复杂逻辑比较
当排序逻辑无法简单用 key 表达(比如需要访问相邻元素、有状态判断、或已有旧式比较函数),可用 functools.cmp_to_key 将传统“两参数比较函数”转为 key 可用的对象。
- 比较函数签名是
def compare(a, b) → int:返回负数(a 在 b 前)、零(相等)、正数(a 在 b 后) - 转换后传给
key=即可:from functools import cmp_to_key<br><br>def by_length_then_alpha(a, b):<br> if len(a) != len(b):<br> return len(a) - len(b)<br> return -1 if a < b else (1 if a > b else 0)<br><br>words = ['hi', 'hello', 'a', 'world']<br>sorted(words, key=cmp_to_key(by_length_then_alpha)) # → ['a', 'hi', 'hello', 'world']
在类中定义自然排序行为(__lt__ 等)
若希望某类实例默认就支持排序(如直接调用 sorted(my_objects)),可在类中实现富比较方法,最常用的是 __lt__(less than)。
立即学习“Python免费学习笔记(深入)”;
- 只需实现
__lt__,sorted()就能工作(它只依赖) - 例子:
class Person:<br> def __init__(self, name, age):<br> self.name = name<br> self.age = age<br> def __lt__(self, other):<br> return self.age < other.age # 按年龄升序<br><br>people = [Person('Alice', 30), Person('Bob', 25)]<br>sorted(people) # 自动按 age 排 - 如需完整比较支持(==, !=, >, etc.),可用
@total_ordering装饰器,只需定义__lt__和__eq__
注意稳定性与性能取舍
Python 的 sort 和 sorted 是稳定排序——相等元素的相对顺序不会改变。这点在多级排序中很有用(比如先按分数排,再按提交时间排,可保证同分者按时间先后不乱)。
-
key方式高效且简洁,每次调用只计算一次键值(内部会缓存),适合大多数场景 -
cmp_to_key会有额外函数调用开销,且比较次数更多(O(n log n) 次比较,每次调两个参数),仅在逻辑确实绕不开时使用 - 避免在
key函数里做耗时操作(如读文件、网络请求),否则严重拖慢排序速度










