0

0

Python浏览器Cookie通用获取教程

碧海醫心

碧海醫心

发布时间:2025-08-02 23:42:11

|

641人浏览过

|

来源于php中文网

原创

Python浏览器Cookie通用获取教程

本教程旨在详细介绍如何使用Python通用且有效地获取主流浏览器(如Chrome、Firefox、Edge等)中存储的Cookie。文章将探讨直接访问浏览器数据库的挑战,并重点介绍通过browser_cookie3库实现跨浏览器Cookie读取的实用方法,同时也会阐述如何利用requests库管理HTTP会话中的Cookie,并明确区分这两种场景的应用。

1. 理解浏览器Cookie的存储与挑战

现代web浏览器为了用户隐私和安全,对cookie的存储机制进行了复杂化处理。它们通常将cookie数据存储在本地的sqlite数据库中,并对敏感信息(特别是基于chromium的浏览器如chrome、edge、brave等)进行加密。直接访问这些数据库并解析cookie面临多重挑战:

  • 路径差异: 不同操作系统、不同浏览器甚至同一浏览器的不同版本,其Cookie数据库的存储路径可能各不相同。
  • 权限问题: 访问受保护的用户配置文件目录下的数据库文件,常常会遇到“权限拒绝”的错误,即使以管理员身份运行也可能无法解决,因为文件可能被浏览器进程锁定。
  • 数据加密: 大多数浏览器对Cookie值进行了加密,尤其是在Windows系统上,通常使用DPAPI (Data Protection API) 进行加密,这使得直接读取的Cookie值无法识别,需要专门的解密过程。
  • 数据库结构: 即使能访问到数据库,其表结构也可能因浏览器和版本而异,增加了解析的复杂性。

因此,尝试通过硬编码路径和直接SQLite查询来获取所有浏览器Cookie的方法通常效率低下且容易失败。

2. 使用 browser_cookie3 库实现通用Cookie获取

browser_cookie3 是一个强大的第三方Python库,它抽象了不同浏览器的Cookie存储细节和加密机制,提供了一种相对通用且简便的方式来获取已安装浏览器的Cookie。该库支持Chrome、Firefox、Edge、Brave、Opera、Safari等主流浏览器。

2.1 安装 browser_cookie3

首先,确保你的环境中安装了 browser_cookie3 库。可以通过pip进行安装:

pip install browser_cookie3

2.2 获取特定浏览器的Cookie

browser_cookie3 提供了针对不同浏览器的函数,例如 chrome()、firefox()、edge() 等,它们会返回一个 http.cookiejar.CookieJar 对象,可以直接与 requests 库配合使用。

立即学习Python免费学习笔记(深入)”;

以下示例展示如何获取Chrome浏览器的Cookie,并打印其名称、值和域:

Python开发网站指南 WORD版
Python开发网站指南 WORD版

本文档主要讲述的是Python开发网站指南;HTML是网络的通用语言,一种简单、通用的全置标记语言。它允许网页制作人建立文本与图片相结合的复杂页面,这些页面可以被网上任何其他人浏览到,无论使用的是什么类型的电脑或浏览器 Python和其他程序语言一样,有自身的一套流程控制语句,而且这些语句的语法和其它程序语言类似,都有for, if ,while 类的关键字来表达程序流程。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
import requests
import browser_cookie3
import http.cookiejar

def get_browser_cookies(browser_name="chrome"):
    """
    获取指定浏览器的Cookie。
    :param browser_name: 浏览器名称,如 'chrome', 'firefox', 'edge', 'brave' 等。
    :return: http.cookiejar.CookieJar 对象,包含浏览器Cookie。
    """
    try:
        if browser_name == "chrome":
            cj = browser_cookie3.chrome()
        elif browser_name == "firefox":
            cj = browser_cookie3.firefox()
        elif browser_name == "edge":
            cj = browser_cookie3.edge()
        elif browser_name == "brave":
            cj = browser_cookie3.brave()
        # 可以根据需要添加更多浏览器
        else:
            print(f"不支持的浏览器类型: {browser_name}")
            return None
        return cj
    except Exception as e:
        print(f"获取 {browser_name} Cookie时发生错误: {e}")
        return None

if __name__ == "__main__":
    # 示例1:获取Chrome浏览器的Cookie并打印
    print("--- 获取 Chrome 浏览器 Cookie ---")
    chrome_cookies = get_browser_cookies("chrome")
    if chrome_cookies:
        for cookie in chrome_cookies:
            print(f"名称: {cookie.name}")
            print(f"值: {cookie.value}")
            print(f"域: {cookie.domain}")
            print("-" * 30)
        print(f"Chrome Cookie数量: {len(chrome_cookies)}")

        # 示例2:将获取到的Cookie用于requests请求
        print("\n--- 使用获取到的 Chrome Cookie 访问 Google ---")
        try:
            # 注意:某些网站可能会有反爬机制,直接使用浏览器Cookie可能无效或被检测
            r = requests.get("https://www.google.com", cookies=chrome_cookies, timeout=10)
            print(f"访问 Google 状态码: {r.status_code}")
            # print(r.text[:500]) # 打印部分响应内容
        except requests.exceptions.RequestException as e:
            print(f"请求 Google 失败: {e}")

    # 示例3:获取Firefox浏览器的Cookie
    print("\n--- 获取 Firefox 浏览器 Cookie ---")
    firefox_cookies = get_browser_cookies("firefox")
    if firefox_cookies:
        for cookie in firefox_cookies:
            print(f"名称: {cookie.name}")
            print(f"值: {cookie.value}")
            print(f"域: {cookie.domain}")
            print("-" * 30)
        print(f"Firefox Cookie数量: {len(firefox_cookies)}")

2.3 browser_cookie3 的工作原理与注意事项

browser_cookie3 库通过以下方式解决上述挑战:

  • 自动路径检测: 它内置了不同操作系统和浏览器版本的Cookie数据库路径检测逻辑。
  • 解密处理: 针对加密的Cookie,它会尝试使用系统API(如Windows上的DPAPI)进行解密,从而获取明文的Cookie值。
  • 文件锁定处理: 在某些情况下,如果浏览器正在运行并锁定了Cookie数据库文件,browser_cookie3 可能仍然无法访问。通常建议在浏览器关闭时运行此脚本,或者在无法访问时捕获异常。
  • 依赖性: 对于Firefox,可能需要安装 pycryptodome 库来处理其加密。对于Chromium系浏览器,它通常依赖于操作系统自带的加密/解密功能。
  • 安全性与隐私: 获取浏览器Cookie涉及到用户敏感信息。在实际应用中,请务必遵守相关法律法规和道德规范,仅在合法、授权的场景下使用此功能。

3. 使用 requests 库管理HTTP会话中的Cookie

与从本地浏览器获取存储的Cookie不同,requests 库主要用于在HTTP请求会话中管理Cookie。这意味着你通过 requests 发起的请求会收到服务器设置的Cookie,并可以在后续请求中自动携带这些Cookie。它不会读取你本地浏览器中已经存在的Cookie。

3.1 基础的会话Cookie管理

requests 库的 Session 对象可以自动处理Cookie:

import requests
import pprint

def get_session_cookies(url):
    """
    通过requests库获取访问指定URL时服务器设置的Cookie。
    注意:这不会获取浏览器本地存储的Cookie。
    """
    print(f"\n--- 访问 {url} 获取会话 Cookie ---")
    session = requests.Session()
    try:
        response = session.get(url, timeout=10)
        print(f"访问 {url} 状态码: {response.status_code}")

        # 获取当前会话中所有的Cookie
        cookies = session.cookies.get_dict()

        if cookies:
            print("当前会话中的Cookie:")
            pprint.pprint(cookies)
        else:
            print("当前会话没有获取到Cookie。")
        return cookies
    except requests.exceptions.RequestException as e:
        print(f"请求 {url} 失败: {e}")
        return {}

if __name__ == "__main__":
    # 示例:获取访问百度时服务器设置的Cookie
    get_session_cookies("https://www.baidu.com")

    # 示例:获取访问Google时服务器设置的Cookie
    get_session_cookies("https://www.google.com")

3.2 requests 会话Cookie的应用场景

  • Web爬虫/数据抓取: 模拟用户登录状态,维持会话。
  • API交互: 在API请求中传递身份验证Cookie。
  • 自动化测试: 模拟用户操作流程,验证Cookie的设置和使用。

4. 总结与应用选择

  • 获取已安装浏览器的本地Cookie: 当你需要访问用户浏览器中已存在的Cookie(例如,用于自动化登录、数据迁移或分析用户浏览习惯等)时,应优先考虑使用 browser_cookie3 这样的第三方库。它能够处理不同浏览器的复杂性、路径和加密问题。
  • 在HTTP请求会话中管理Cookie: 当你通过Python脚本与Web服务器交互,需要发送和接收Cookie以维持会话状态时,requests 库的 Session 对象是最佳选择。它专注于HTTP协议层面的Cookie管理,与本地浏览器存储无关。

选择哪种方法取决于你的具体需求。理解它们之间的差异对于编写高效、准确的Python Web自动化和数据获取脚本至关重要。始终牢记数据隐私和安全,确保你的操作符合法律法规和道德准则。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

756

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

636

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

760

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1264

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

548

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

578

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

708

2023.08.11

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

9

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 1.9万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号