0

0

Python 中 in 运算符在集合和列表中的不同行为详解

碧海醫心

碧海醫心

发布时间:2025-09-25 16:32:30

|

624人浏览过

|

来源于php中文网

原创

python 中 in 运算符在集合和列表中的不同行为详解

本文深入探讨了 Python 中 in 运算符在列表和集合等数据结构中的不同行为。通过分析其内部实现机制,解释了为何在处理 PyTorch 张量时,in 运算符在列表和集合中会产生不同的结果。此外,本文还提供了自定义类和代码示例,帮助读者更好地理解哈希表在集合查找中的作用,并针对特定问题提供有效的解决方案。

在 Python 中,in 运算符用于检查某个元素是否存在于一个集合(collection)中。然而,in 运算符的具体行为取决于集合的类型,尤其是集合是否使用了内部哈希表。 了解这些差异对于编写高效且无错误的 Python 代码至关重要。

in 运算符的工作原理

x in collection 的行为根据 collection 的类型而异。

不使用哈希表的集合 (列表、元组等)

对于不使用哈希表的集合,例如列表和元组,in 运算符会遍历集合中的每个元素,并逐个比较 x 和集合中的元素 c,直到找到匹配项。

其伪代码如下:

立即学习Python免费学习笔记(深入)”;

def is_in(x, collection):
  for c in collection:
      if (x is c or x==c):
          return True
  return False

该过程首先比较对象的标识 (is),如果标识不同,则比较值 (==)。

使用哈希表的集合 (集合、字典等)

对于使用哈希表的集合,例如集合和字典,in 运算符会先计算 x 的哈希值,然后查找集合中具有相同哈希值的元素子集。

其伪代码如下:

立即学习Python免费学习笔记(深入)”;

def is_in(x, collection):
  # 选择集合中哈希值与 x 相同的元素子集
  subset = get_subset_by_hash(collection, hash(x))
  for c in subset:
      if (x is c or x==c):
          return True
  return False

这种方法大大提高了查找速度,因为只需要比较哈希值相同的元素,而无需遍历整个集合。

示例:自定义类和哈希表

为了更好地理解 in 运算符的行为,我们可以创建一个自定义类 MyObj,并定义其哈希计算逻辑 (__hash__) 和相等性比较逻辑 (__eq__)。

Python精要参考 pdf版
Python精要参考 pdf版

这本书给出了一份关于python这门优美语言的精要的参考。作者通过一个完整而清晰的入门指引将你带入python的乐园,随后在语法、类型和对象、运算符与表达式、控制流函数与函数编程、类及面向对象编程、模块和包、输入输出、执行环境等多方面给出了详尽的讲解。如果你想加入 python的世界,David M beazley的这本书可不要错过哦。 (封面是最新英文版的,中文版貌似只译到第二版)

下载
class MyObj:
    def __init__(self, val, hashval):
        self._val = val
        self._hashval = hashval

    def __hash__(self):
        print(f"{str(self)} calling __hash__")
        return self._hashval

    def __eq__(self, other):
        print(f"{str(self)} calling __eq__, other={other}")
        return super().__eq__(other)

    def __repr__(self):
        return f"<{self.__class__.__name__}: {self._val}>"

然后,创建 MyObj 的几个实例,并将其添加到集合和列表中:

a = MyObj("a", 123)
b = MyObj("b", 456)
d = MyObj("d", 456)  # 与 b 相同的哈希值

print("创建集合 `s`")
s = set([a, b, d])

print("创建列表 `lst`")
lst = [a, b, d]

运行这段代码会发现,在创建集合时,Python 会计算每个元素的哈希值,并且如果存在哈希冲突(例如 b 和 d 的哈希值相同),则会调用 __eq__ 方法进行比较。

接下来,可以使用 in 运算符来检查元素是否存在于集合和列表中,并观察其行为差异。

>>> s
{, , }
>>> b in s
 calling __hash__
True
>>> d in s
 calling __hash__
 calling __eq__, other=
 calling __eq__, other=
True

在集合中,Python 首先计算 b 和 d 的哈希值。如果存在哈希冲突,则会调用 __eq__ 方法进行比较。

>>> lst
[, , ]
>>> a in lst
True
>>> b in lst
 calling __eq__, other=
 calling __eq__, other=
True
>>> d in lst
 calling __eq__, other=
 calling __eq__, other=
 calling __eq__, other=
 calling __eq__, other=
True

在列表中,Python 会依次比较每个元素,直到找到匹配项。

PyTorch 张量和 in 运算符

在使用 PyTorch 张量时,in 运算符的行为可能会有所不同。这是因为 PyTorch 张量重载了 == 运算符,如果两个张量的形状不同,则会引发 RuntimeError。

import torch
a = torch.Tensor(2,3)
b = torch.Tensor(2)

# case 1a:
# b  in list([a,a,b]) # raises an error: 
# Traceback (most recent call last):
#   File "", line 1, in 
# RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 0

# case 1b
b in set([a,a,b]) # True (i.e. no error)

在列表 [a, b] 中,当使用 b in [a, b] 时,Python 会首先比较 b is a(标识比较),如果结果为 False,则会比较 b == a(值比较)。由于 a 和 b 的形状不同,因此 b == a 会引发 RuntimeError。

在集合 {a, b} 中,当使用 b in {a, b} 时,Python 会首先计算 a 和 b 的哈希值。由于 torch.Tensor 的哈希值是其内存地址,因此 a 和 b 的哈希值不同。因此,b == a 不会被执行,从而避免了 RuntimeError。

解决方案

为了避免 RuntimeError,可以使用 torch.Tensor.size() 属性来创建不同大小张量的集合。

import torch

# 创建不同大小张量的字典
tensor_dict = {}

# 添加张量到字典
def add_tensor(tensor, tensor_dict):
  size = tuple(tensor.size()) # 将 torch.Size 转换为元组
  if size not in tensor_dict:
    tensor_dict[size] = set()
  tensor_dict[size].add(tensor)

# 检查张量是否存在于字典中
def tensor_in_dict(tensor, tensor_dict):
  size = tuple(tensor.size()) # 将 torch.Size 转换为元组
  return size in tensor_dict and tensor in tensor_dict[size]

# 示例用法
a = torch.Tensor(2, 3)
b = torch.Tensor(2)

add_tensor(a, tensor_dict)
add_tensor(b, tensor_dict)

print(tensor_in_dict(b, tensor_dict)) # 输出 True

总结

in 运算符在 Python 中是一个非常有用的工具,但了解其在不同数据结构中的行为至关重要。对于使用哈希表的集合,in 运算符的查找速度更快,但在处理特殊类型的对象(例如 PyTorch 张量)时,需要注意潜在的错误。 通过使用适当的数据结构和比较方法,可以编写高效且无错误的 Python 代码。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1498

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

231

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

87

2025.10.17

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

538

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

17

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

25

2026.01.06

pytorch是干嘛的
pytorch是干嘛的

pytorch是一个基于python的深度学习框架,提供以下主要功能:动态图计算,提供灵活性。强大的张量操作,实现高效处理。自动微分,简化梯度计算。预构建的神经网络模块,简化模型构建。各种优化器,用于性能优化。想了解更多pytorch的相关内容,可以阅读本专题下面的文章。

432

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习
Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架,是一种通常用于图像识别和语言处理等应用程序的机器学习。 使用Python 编写,因此对于大多数机器学习开发者而言,学习和使用起来相对简单。 PyTorch 的独特之处在于,它完全支持GPU,并且使用反向模式自动微分技术,因此可以动态修改计算图形。

24

2025.12.22

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号