Python浏览器Cookie通用获取教程

碧海醫心

发布时间：2025-08-02 23:42:11

641人浏览过

来源于php中文网

原创

Python浏览器Cookie通用获取教程

本教程旨在详细介绍如何使用Python通用且有效地获取主流浏览器（如Chrome、Firefox、Edge等）中存储的Cookie。文章将探讨直接访问浏览器数据库的挑战，并重点介绍通过browser_cookie3库实现跨浏览器Cookie读取的实用方法，同时也会阐述如何利用requests库管理HTTP会话中的Cookie，并明确区分这两种场景的应用。

1. 理解浏览器Cookie的存储与挑战

现代web浏览器为了用户隐私和安全，对cookie的存储机制进行了复杂化处理。它们通常将cookie数据存储在本地的sqlite数据库中，并对敏感信息（特别是基于chromium的浏览器如chrome、edge、brave等）进行加密。直接访问这些数据库并解析cookie面临多重挑战：

路径差异： 不同操作系统、不同浏览器甚至同一浏览器的不同版本，其Cookie数据库的存储路径可能各不相同。
权限问题： 访问受保护的用户配置文件目录下的数据库文件，常常会遇到“权限拒绝”的错误，即使以管理员身份运行也可能无法解决，因为文件可能被浏览器进程锁定。
数据加密： 大多数浏览器对Cookie值进行了加密，尤其是在Windows系统上，通常使用DPAPI (Data Protection API) 进行加密，这使得直接读取的Cookie值无法识别，需要专门的解密过程。
数据库结构： 即使能访问到数据库，其表结构也可能因浏览器和版本而异，增加了解析的复杂性。

因此，尝试通过硬编码路径和直接SQLite查询来获取所有浏览器Cookie的方法通常效率低下且容易失败。

2. 使用 browser_cookie3 库实现通用Cookie获取

browser_cookie3 是一个强大的第三方Python库，它抽象了不同浏览器的Cookie存储细节和加密机制，提供了一种相对通用且简便的方式来获取已安装浏览器的Cookie。该库支持Chrome、Firefox、Edge、Brave、Opera、Safari等主流浏览器。

2.1 安装 browser_cookie3

首先，确保你的环境中安装了 browser_cookie3 库。可以通过pip进行安装：

pip install browser_cookie3

2.2 获取特定浏览器的Cookie

browser_cookie3 提供了针对不同浏览器的函数，例如 chrome()、firefox()、edge() 等，它们会返回一个 http.cookiejar.CookieJar 对象，可以直接与 requests 库配合使用。

立即学习“Python免费学习笔记（深入）”；

Python开发网站指南 WORD版

本文档主要讲述的是Python开发网站指南；HTML是网络的通用语言,一种简单、通用的全置标记语言。它允许网页制作人建立文本与图片相结合的复杂页面，这些页面可以被网上任何其他人浏览到，无论使用的是什么类型的电脑或浏览器 Python和其他程序语言一样，有自身的一套流程控制语句，而且这些语句的语法和其它程序语言类似，都有for, if ,while 类的关键字来表达程序流程。希望本文档会给有需要的朋友带来帮助；感兴趣的朋友可以过来看看

下载

以下示例展示如何获取Chrome浏览器的Cookie，并打印其名称、值和域：

import requests
import browser_cookie3
import http.cookiejar

def get_browser_cookies(browser_name="chrome"):
    """
    获取指定浏览器的Cookie。
    :param browser_name: 浏览器名称，如 'chrome', 'firefox', 'edge', 'brave' 等。
    :return: http.cookiejar.CookieJar 对象，包含浏览器Cookie。
    """
    try:
        if browser_name == "chrome":
            cj = browser_cookie3.chrome()
        elif browser_name == "firefox":
            cj = browser_cookie3.firefox()
        elif browser_name == "edge":
            cj = browser_cookie3.edge()
        elif browser_name == "brave":
            cj = browser_cookie3.brave()
        # 可以根据需要添加更多浏览器
        else:
            print(f"不支持的浏览器类型: {browser_name}")
            return None
        return cj
    except Exception as e:
        print(f"获取 {browser_name} Cookie时发生错误: {e}")
        return None

if __name__ == "__main__":
    # 示例1：获取Chrome浏览器的Cookie并打印
    print("--- 获取 Chrome 浏览器 Cookie ---")
    chrome_cookies = get_browser_cookies("chrome")
    if chrome_cookies:
        for cookie in chrome_cookies:
            print(f"名称: {cookie.name}")
            print(f"值: {cookie.value}")
            print(f"域: {cookie.domain}")
            print("-" * 30)
        print(f"Chrome Cookie数量: {len(chrome_cookies)}")

        # 示例2：将获取到的Cookie用于requests请求
        print("\n--- 使用获取到的 Chrome Cookie 访问 Google ---")
        try:
            # 注意：某些网站可能会有反爬机制，直接使用浏览器Cookie可能无效或被检测
            r = requests.get("https://www.google.com", cookies=chrome_cookies, timeout=10)
            print(f"访问 Google 状态码: {r.status_code}")
            # print(r.text[:500]) # 打印部分响应内容
        except requests.exceptions.RequestException as e:
            print(f"请求 Google 失败: {e}")

    # 示例3：获取Firefox浏览器的Cookie
    print("\n--- 获取 Firefox 浏览器 Cookie ---")
    firefox_cookies = get_browser_cookies("firefox")
    if firefox_cookies:
        for cookie in firefox_cookies:
            print(f"名称: {cookie.name}")
            print(f"值: {cookie.value}")
            print(f"域: {cookie.domain}")
            print("-" * 30)
        print(f"Firefox Cookie数量: {len(firefox_cookies)}")

2.3 browser_cookie3 的工作原理与注意事项

browser_cookie3 库通过以下方式解决上述挑战：

自动路径检测： 它内置了不同操作系统和浏览器版本的Cookie数据库路径检测逻辑。
解密处理： 针对加密的Cookie，它会尝试使用系统API（如Windows上的DPAPI）进行解密，从而获取明文的Cookie值。
文件锁定处理： 在某些情况下，如果浏览器正在运行并锁定了Cookie数据库文件，browser_cookie3 可能仍然无法访问。通常建议在浏览器关闭时运行此脚本，或者在无法访问时捕获异常。
依赖性： 对于Firefox，可能需要安装 pycryptodome 库来处理其加密。对于Chromium系浏览器，它通常依赖于操作系统自带的加密/解密功能。
安全性与隐私： 获取浏览器Cookie涉及到用户敏感信息。在实际应用中，请务必遵守相关法律法规和道德规范，仅在合法、授权的场景下使用此功能。

3. 使用 requests 库管理HTTP会话中的Cookie

与从本地浏览器获取存储的Cookie不同，requests 库主要用于在HTTP请求会话中管理Cookie。这意味着你通过 requests 发起的请求会收到服务器设置的Cookie，并可以在后续请求中自动携带这些Cookie。它不会读取你本地浏览器中已经存在的Cookie。

3.1 基础的会话Cookie管理

requests 库的 Session 对象可以自动处理Cookie：

import requests
import pprint

def get_session_cookies(url):
    """
    通过requests库获取访问指定URL时服务器设置的Cookie。
    注意：这不会获取浏览器本地存储的Cookie。
    """
    print(f"\n--- 访问 {url} 获取会话 Cookie ---")
    session = requests.Session()
    try:
        response = session.get(url, timeout=10)
        print(f"访问 {url} 状态码: {response.status_code}")

        # 获取当前会话中所有的Cookie
        cookies = session.cookies.get_dict()

        if cookies:
            print("当前会话中的Cookie:")
            pprint.pprint(cookies)
        else:
            print("当前会话没有获取到Cookie。")
        return cookies
    except requests.exceptions.RequestException as e:
        print(f"请求 {url} 失败: {e}")
        return {}

if __name__ == "__main__":
    # 示例：获取访问百度时服务器设置的Cookie
    get_session_cookies("https://www.baidu.com")

    # 示例：获取访问Google时服务器设置的Cookie
    get_session_cookies("https://www.google.com")

3.2 requests 会话Cookie的应用场景

Web爬虫/数据抓取： 模拟用户登录状态，维持会话。
API交互： 在API请求中传递身份验证Cookie。
自动化测试： 模拟用户操作流程，验证Cookie的设置和使用。

4. 总结与应用选择

获取已安装浏览器的本地Cookie： 当你需要访问用户浏览器中已存在的Cookie（例如，用于自动化登录、数据迁移或分析用户浏览习惯等）时，应优先考虑使用 browser_cookie3 这样的第三方库。它能够处理不同浏览器的复杂性、路径和加密问题。
在HTTP请求会话中管理Cookie： 当你通过Python脚本与Web服务器交互，需要发送和接收Cookie以维持会话状态时，requests 库的 Session 对象是最佳选择。它专注于HTTP协议层面的Cookie管理，与本地浏览器存储无关。

选择哪种方法取决于你的具体需求。理解它们之间的差异对于编写高效、准确的Python Web自动化和数据获取脚本至关重要。始终牢记数据隐私和安全，确保你的操作符合法律法规和道德准则。

Python 结构化日志实现技巧

Python内存占用如何分析_tracemalloc用法

Python多线程真的并发吗_GIL机制原理解析

Python脚本打包发布_setuptools入门

Python如何写泛型代码_Generic类型设计实践

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SciPy数字滤波器：理解与统一lfilter的批量与迭代处理初始条件下一篇：如何用IDE阅读Python源码实用工具提高Python源码阅读效率

作者最新文章

Python 多输入多输出场景下的灵活参数解析教程

2026-02-28 12:35

如何在 PHP MySQL 中高效获取多个时间区间内的独立计数

2026-02-28 12:37

如何在 PHP MySQL 中高效获取多个时间区间的独立计数

2026-02-28 12:49

如何在运行时通过反射获取类上的类型使用（TYPE_USE）注解

2026-02-28 13:05

如何在 Go 中动态配置 HTTP 客户端代理（仅当用户显式提供时生效）

2026-02-28 13:16

索尼真的要撤了？爆料人称PC移植仅占总收入1.5%

2026-02-28 13:19

《刺客信条：女巫》战斗彻底重做 E叔有望中途登场

2026-02-28 14:05

如何在 Go 中动态配置 HTTP 客户端代理（仅当用户明确提供时生效）

2026-02-28 14:08

首周销量已突破40万套，这款全新的多人派对游戏热度仍在持续增长

2026-02-28 14:20

如何通过 AJAX 根据用户邮箱获取 WordPress 用户 ID

2026-02-28 14:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

chrome什么意思

chrome是浏览器的意思，由Google开发的网络浏览器，它在2008年首次发布，并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容，供大家免费下载体验。

1016

2023.08.11

chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

813

2023.11.06

edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器，是Windows 10操作系统中默认的浏览器，其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容，供大家免费下载体验。

1661

2023.08.21

IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法：1、更改默认浏览器设置；2、阻止edge浏览器的自动跳转；3、更改超链接的默认打开方式；4、禁用“快速网页查看器”；5、卸载edge浏览器；6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

394

2024.03.05

如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题（窗口空白或标题栏缺失），可尝试以下方法解决：重启 Edge：关闭所有窗口，重新启动浏览器。重置窗口布局：右击任务栏 Edge 图标 → 选择「最大化」或「还原」。禁用扩展：进入 edge://extensions 临时关闭插件测试。重置浏览器设置：前往 edge://settings/reset 恢复默认配置。更新或重装 Edge：检查最新版本，或通过控制面板修复

1023

2025.04.24

pip安装使用方法

安装步骤：1、确保Python已经正确安装在您的计算机上；2、下载“get-pip.py”脚本；3、按下Win + R键，然后输入cmd并按下Enter键来打开命令行窗口；4、在命令行窗口中，使用cd命令切换到“get-pip.py”所在的目录；5、执行安装命令；6、验证安装结果即可。大家可以访问本专题下的文章，了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容，请阅读专题下面的文章。

430

2024.12.20

pip设置清华源

设置方法：1、打开终端或命令提示符窗口；2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件；3、打开pip.conf文件，然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容，这将把pip的镜像源设置为清华大学的镜像源；4、保存并关闭文件即可。

793

2024.12.23

Golang 测试体系与代码质量保障：工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链（如go test）、单元测试、集成测试及端到端测试实践，结合代码覆盖率分析、静态代码扫描（如go vet）和动态分析工具，建立全链路质量监控机制。通过自动化测试框架、持续集成（CI）流水线配置及代码审查规范，实现测试用例管理、缺陷追踪与质量门禁控制，确保代码健壮性与可维护性，为高可靠性工程系统提供质量保障。

2026.02.28

热门下载

网站特效

网站源码

网站素材

前端模板