0

0

Python浏览器Cookie通用获取教程

碧海醫心

碧海醫心

发布时间:2025-08-02 23:42:11

|

641人浏览过

|

来源于php中文网

原创

Python浏览器Cookie通用获取教程

本教程旨在详细介绍如何使用Python通用且有效地获取主流浏览器(如Chrome、Firefox、Edge等)中存储的Cookie。文章将探讨直接访问浏览器数据库的挑战,并重点介绍通过browser_cookie3库实现跨浏览器Cookie读取的实用方法,同时也会阐述如何利用requests库管理HTTP会话中的Cookie,并明确区分这两种场景的应用。

1. 理解浏览器Cookie的存储与挑战

现代web浏览器为了用户隐私和安全,对cookie的存储机制进行了复杂化处理。它们通常将cookie数据存储在本地的sqlite数据库中,并对敏感信息(特别是基于chromium的浏览器如chrome、edge、brave等)进行加密。直接访问这些数据库并解析cookie面临多重挑战:

  • 路径差异: 不同操作系统、不同浏览器甚至同一浏览器的不同版本,其Cookie数据库的存储路径可能各不相同。
  • 权限问题: 访问受保护的用户配置文件目录下的数据库文件,常常会遇到“权限拒绝”的错误,即使以管理员身份运行也可能无法解决,因为文件可能被浏览器进程锁定。
  • 数据加密: 大多数浏览器对Cookie值进行了加密,尤其是在Windows系统上,通常使用DPAPI (Data Protection API) 进行加密,这使得直接读取的Cookie值无法识别,需要专门的解密过程。
  • 数据库结构: 即使能访问到数据库,其表结构也可能因浏览器和版本而异,增加了解析的复杂性。

因此,尝试通过硬编码路径和直接SQLite查询来获取所有浏览器Cookie的方法通常效率低下且容易失败。

2. 使用 browser_cookie3 库实现通用Cookie获取

browser_cookie3 是一个强大的第三方Python库,它抽象了不同浏览器的Cookie存储细节和加密机制,提供了一种相对通用且简便的方式来获取已安装浏览器的Cookie。该库支持Chrome、Firefox、Edge、Brave、Opera、Safari等主流浏览器。

2.1 安装 browser_cookie3

首先,确保你的环境中安装了 browser_cookie3 库。可以通过pip进行安装:

pip install browser_cookie3

2.2 获取特定浏览器的Cookie

browser_cookie3 提供了针对不同浏览器的函数,例如 chrome()、firefox()、edge() 等,它们会返回一个 http.cookiejar.CookieJar 对象,可以直接与 requests 库配合使用。

立即学习Python免费学习笔记(深入)”;

Python开发网站指南 WORD版
Python开发网站指南 WORD版

本文档主要讲述的是Python开发网站指南;HTML是网络的通用语言,一种简单、通用的全置标记语言。它允许网页制作人建立文本与图片相结合的复杂页面,这些页面可以被网上任何其他人浏览到,无论使用的是什么类型的电脑或浏览器 Python和其他程序语言一样,有自身的一套流程控制语句,而且这些语句的语法和其它程序语言类似,都有for, if ,while 类的关键字来表达程序流程。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载

以下示例展示如何获取Chrome浏览器的Cookie,并打印其名称、值和域:

import requests
import browser_cookie3
import http.cookiejar

def get_browser_cookies(browser_name="chrome"):
    """
    获取指定浏览器的Cookie。
    :param browser_name: 浏览器名称,如 'chrome', 'firefox', 'edge', 'brave' 等。
    :return: http.cookiejar.CookieJar 对象,包含浏览器Cookie。
    """
    try:
        if browser_name == "chrome":
            cj = browser_cookie3.chrome()
        elif browser_name == "firefox":
            cj = browser_cookie3.firefox()
        elif browser_name == "edge":
            cj = browser_cookie3.edge()
        elif browser_name == "brave":
            cj = browser_cookie3.brave()
        # 可以根据需要添加更多浏览器
        else:
            print(f"不支持的浏览器类型: {browser_name}")
            return None
        return cj
    except Exception as e:
        print(f"获取 {browser_name} Cookie时发生错误: {e}")
        return None

if __name__ == "__main__":
    # 示例1:获取Chrome浏览器的Cookie并打印
    print("--- 获取 Chrome 浏览器 Cookie ---")
    chrome_cookies = get_browser_cookies("chrome")
    if chrome_cookies:
        for cookie in chrome_cookies:
            print(f"名称: {cookie.name}")
            print(f"值: {cookie.value}")
            print(f"域: {cookie.domain}")
            print("-" * 30)
        print(f"Chrome Cookie数量: {len(chrome_cookies)}")

        # 示例2:将获取到的Cookie用于requests请求
        print("\n--- 使用获取到的 Chrome Cookie 访问 Google ---")
        try:
            # 注意:某些网站可能会有反爬机制,直接使用浏览器Cookie可能无效或被检测
            r = requests.get("https://www.google.com", cookies=chrome_cookies, timeout=10)
            print(f"访问 Google 状态码: {r.status_code}")
            # print(r.text[:500]) # 打印部分响应内容
        except requests.exceptions.RequestException as e:
            print(f"请求 Google 失败: {e}")

    # 示例3:获取Firefox浏览器的Cookie
    print("\n--- 获取 Firefox 浏览器 Cookie ---")
    firefox_cookies = get_browser_cookies("firefox")
    if firefox_cookies:
        for cookie in firefox_cookies:
            print(f"名称: {cookie.name}")
            print(f"值: {cookie.value}")
            print(f"域: {cookie.domain}")
            print("-" * 30)
        print(f"Firefox Cookie数量: {len(firefox_cookies)}")

2.3 browser_cookie3 的工作原理与注意事项

browser_cookie3 库通过以下方式解决上述挑战:

  • 自动路径检测: 它内置了不同操作系统和浏览器版本的Cookie数据库路径检测逻辑。
  • 解密处理: 针对加密的Cookie,它会尝试使用系统API(如Windows上的DPAPI)进行解密,从而获取明文的Cookie值。
  • 文件锁定处理: 在某些情况下,如果浏览器正在运行并锁定了Cookie数据库文件,browser_cookie3 可能仍然无法访问。通常建议在浏览器关闭时运行此脚本,或者在无法访问时捕获异常。
  • 依赖性: 对于Firefox,可能需要安装 pycryptodome 库来处理其加密。对于Chromium系浏览器,它通常依赖于操作系统自带的加密/解密功能。
  • 安全性与隐私: 获取浏览器Cookie涉及到用户敏感信息。在实际应用中,请务必遵守相关法律法规和道德规范,仅在合法、授权的场景下使用此功能。

3. 使用 requests 库管理HTTP会话中的Cookie

与从本地浏览器获取存储的Cookie不同,requests 库主要用于在HTTP请求会话中管理Cookie。这意味着你通过 requests 发起的请求会收到服务器设置的Cookie,并可以在后续请求中自动携带这些Cookie。它不会读取你本地浏览器中已经存在的Cookie。

3.1 基础的会话Cookie管理

requests 库的 Session 对象可以自动处理Cookie:

import requests
import pprint

def get_session_cookies(url):
    """
    通过requests库获取访问指定URL时服务器设置的Cookie。
    注意:这不会获取浏览器本地存储的Cookie。
    """
    print(f"\n--- 访问 {url} 获取会话 Cookie ---")
    session = requests.Session()
    try:
        response = session.get(url, timeout=10)
        print(f"访问 {url} 状态码: {response.status_code}")

        # 获取当前会话中所有的Cookie
        cookies = session.cookies.get_dict()

        if cookies:
            print("当前会话中的Cookie:")
            pprint.pprint(cookies)
        else:
            print("当前会话没有获取到Cookie。")
        return cookies
    except requests.exceptions.RequestException as e:
        print(f"请求 {url} 失败: {e}")
        return {}

if __name__ == "__main__":
    # 示例:获取访问百度时服务器设置的Cookie
    get_session_cookies("https://www.baidu.com")

    # 示例:获取访问Google时服务器设置的Cookie
    get_session_cookies("https://www.google.com")

3.2 requests 会话Cookie的应用场景

  • Web爬虫/数据抓取: 模拟用户登录状态,维持会话。
  • API交互: 在API请求中传递身份验证Cookie。
  • 自动化测试: 模拟用户操作流程,验证Cookie的设置和使用。

4. 总结与应用选择

  • 获取已安装浏览器的本地Cookie: 当你需要访问用户浏览器中已存在的Cookie(例如,用于自动化登录、数据迁移或分析用户浏览习惯等)时,应优先考虑使用 browser_cookie3 这样的第三方库。它能够处理不同浏览器的复杂性、路径和加密问题。
  • 在HTTP请求会话中管理Cookie: 当你通过Python脚本与Web服务器交互,需要发送和接收Cookie以维持会话状态时,requests 库的 Session 对象是最佳选择。它专注于HTTP协议层面的Cookie管理,与本地浏览器存储无关。

选择哪种方法取决于你的具体需求。理解它们之间的差异对于编写高效、准确的Python Web自动化和数据获取脚本至关重要。始终牢记数据隐私和安全,确保你的操作符合法律法规和道德准则。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
chrome什么意思
chrome什么意思

chrome是浏览器的意思,由Google开发的网络浏览器,它在2008年首次发布,并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容,供大家免费下载体验。

1016

2023.08.11

chrome无法加载插件怎么办
chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

813

2023.11.06

edge是什么浏览器
edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器,是Windows 10操作系统中默认的浏览器,其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容,供大家免费下载体验。

1661

2023.08.21

IE浏览器自动跳转EDGE如何恢复
IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法:1、更改默认浏览器设置;2、阻止edge浏览器的自动跳转;3、更改超链接的默认打开方式;4、禁用“快速网页查看器”;5、卸载edge浏览器;6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

394

2024.03.05

如何解决Edge打开但没有标题的问题
如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题(窗口空白或标题栏缺失),可尝试以下方法解决: 重启 Edge:关闭所有窗口,重新启动浏览器。 重置窗口布局:右击任务栏 Edge 图标 → 选择「最大化」或「还原」。 禁用扩展:进入 edge://extensions 临时关闭插件测试。 重置浏览器设置:前往 edge://settings/reset 恢复默认配置。 更新或重装 Edge:检查最新版本,或通过控制面板修复

1023

2025.04.24

pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

430

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

793

2024.12.23

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号