0

0

Python通用浏览器Cookie获取教程

聖光之護

聖光之護

发布时间:2025-08-02 23:04:01

|

686人浏览过

|

来源于php中文网

原创

Python通用浏览器Cookie获取教程

本文旨在提供一套在Python中通用且高效地获取主流浏览器(如Chrome、Firefox、Edge等)存储的Cookie的方法。我们将探讨直接文件访问的局限性,并重点介绍如何利用第三方库browser_cookie3来安全、便捷地提取和使用浏览器Cookie,同时也会讲解如何通过requests库管理HTTP会话中的Cookie,帮助开发者解决跨浏览器Cookie访问的难题。

引言

在进行网络自动化、数据抓取或模拟用户行为时,获取并管理浏览器中存储的cookie是常见的需求。然而,不同浏览器存储cookie的方式各异,且出于安全考虑,许多浏览器(特别是基于chromium的浏览器)会对cookie数据进行加密。直接通过文件系统访问cookie数据库往往会遇到权限问题、加密障碍或路径不兼容等挑战。本教程将介绍两种主要的python方法来应对这些挑战:一种是利用专门的第三方库直接读取浏览器存储的cookie,另一种是在http请求会话中管理cookie。

直接读取浏览器存储的Cookie:使用 browser_cookie3

对于需要从浏览器本地存储中提取Cookie的场景,例如获取用户登录状态的Cookie以便后续模拟登录或访问受限页面,browser_cookie3是一个非常强大的第三方库。它能够抽象化不同浏览器的Cookie存储机制(包括处理加密),提供统一的接口。

1. 安装 browser_cookie3

首先,确保你的Python环境中安装了browser_cookie3库。如果没有,可以通过pip进行安装:

pip install browser_cookie3

2. browser_cookie3 的工作原理

browser_cookie3库会自动检测当前操作系统上安装的常见浏览器(如Chrome、Firefox、Edge、Brave等),并尝试读取它们的Cookie。对于Chrome、Edge等加密Cookie的浏览器,它会尝试使用操作系统提供的API(如Windows的DPAPI)进行解密。

3. 获取并打印浏览器Cookie

以下示例展示了如何使用browser_cookie3来获取特定浏览器或所有支持的浏览器的Cookie,并打印出它们的名称、值和所属域。

立即学习Python免费学习笔记(深入)”;

import browser_cookie3
import http.cookiejar

def get_all_browser_cookies():
    """
    尝试获取所有支持的浏览器(Chrome, Firefox, Edge, Brave等)的Cookie。
    """
    print("尝试获取Chrome浏览器Cookie...")
    try:
        cj_chrome = browser_cookie3.chrome()
        print_cookies(cj_chrome, "Chrome")
    except Exception as e:
        print(f"获取Chrome Cookie失败: {e}")

    print("\n尝试获取Firefox浏览器Cookie...")
    try:
        cj_firefox = browser_cookie3.firefox()
        print_cookies(cj_firefox, "Firefox")
    except Exception as e:
        print(f"获取Firefox Cookie失败: {e}")

    print("\n尝试获取Edge浏览器Cookie...")
    try:
        cj_edge = browser_cookie3.edge()
        print_cookies(cj_edge, "Edge")
    except Exception as e:
        print(f"获取Edge Cookie失败: {e}")

    # 对于其他基于Chromium的浏览器,如Brave,通常也可以使用chrome()或edge()方法尝试
    # print("\n尝试获取Brave浏览器Cookie...")
    # try:
    #     cj_brave = browser_cookie3.brave() # 如果有专门的方法
    #     print_cookies(cj_brave, "Brave")
    # except Exception as e:
    #     print(f"获取Brave Cookie失败: {e}")

def print_cookies(cookie_jar: http.cookiejar.CookieJar, browser_name: str):
    """
    打印给定CookieJar中的Cookie信息。
    """
    if not cookie_jar:
        print(f"  {browser_name}中没有找到Cookie或获取失败。")
        return

    print(f"  从 {browser_name} 获取到 {len(cookie_jar)} 个Cookie:")
    for i, cookie in enumerate(cookie_jar):
        print(f"  --- Cookie {i+1} ---")
        print(f"    名称: {cookie.name}")
        print(f"    值: {cookie.value}")
        print(f"    域: {cookie.domain}")
        print(f"    路径: {cookie.path}")
        print(f"    过期时间: {cookie.expires}")
        print(f"    安全: {cookie.secure}")
        print(f"    HttpOnly: {cookie.has_nonstandard_attr('HttpOnly')}")

if __name__ == "__main__":
    get_all_browser_cookies()

代码解释:

  • browser_cookie3.chrome()、browser_cookie3.firefox()、browser_cookie3.edge()等函数会返回一个http.cookiejar.CookieJar对象,其中包含了从对应浏览器获取到的所有Cookie。
  • 我们可以像遍历列表一样遍历CookieJar对象,访问每个Cookie对象的name、value、domain等属性。

4. 将浏览器Cookie与 requests 库结合使用

获取到浏览器Cookie后,最常见的用途是将其传递给requests库,以便在发起HTTP请求时模拟浏览器行为。

Python开发网站指南 WORD版
Python开发网站指南 WORD版

本文档主要讲述的是Python开发网站指南;HTML是网络的通用语言,一种简单、通用的全置标记语言。它允许网页制作人建立文本与图片相结合的复杂页面,这些页面可以被网上任何其他人浏览到,无论使用的是什么类型的电脑或浏览器 Python和其他程序语言一样,有自身的一套流程控制语句,而且这些语句的语法和其它程序语言类似,都有for, if ,while 类的关键字来表达程序流程。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
import requests
import browser_cookie3

def use_browser_cookies_with_requests(url: str):
    """
    使用Chrome浏览器的Cookie访问指定URL。
    """
    try:
        # 获取Chrome浏览器的CookieJar对象
        cj = browser_cookie3.chrome()
        print(f"成功获取到 {len(cj)} 个Chrome浏览器Cookie。")

        # 使用获取到的Cookie发起请求
        print(f"正在使用Cookie访问: {url}")
        response = requests.get(url, cookies=cj)

        print(f"\n请求状态码: {response.status_code}")
        # 打印响应头中的Set-Cookie信息,如果目标网站有设置新Cookie
        # print("响应头中的Set-Cookie:", response.headers.get('Set-Cookie'))

        # 打印部分响应内容以验证
        print("\n响应内容(部分):")
        print(response.text[:500]) # 打印前500个字符

    except Exception as e:
        print(f"使用浏览器Cookie访问 {url} 失败: {e}")

if __name__ == "__main__":
    target_url = "https://google.com" # 替换为你想访问的URL
    use_browser_cookies_with_requests(target_url)

注意事项:

  • 权限问题: 在某些操作系统或环境下,程序可能需要管理员权限才能访问浏览器存储Cookie的目录。如果遇到Permission Denied错误,请尝试以管理员身份运行脚本。
  • 浏览器运行状态: 某些浏览器在运行时可能会锁定其Cookie数据库文件。如果脚本报错文件被占用,请尝试关闭浏览器再运行。
  • 隐私与安全: 直接获取用户浏览器Cookie涉及敏感信息。请务必在合法、合规、有授权的情况下使用此功能,并注意保护获取到的Cookie数据。
  • 加密: browser_cookie3能够处理Chrome等浏览器的加密Cookie,但其依赖于操作系统提供的解密机制。

在HTTP请求会话中管理Cookie:使用 requests.Session

除了从浏览器本地存储中获取Cookie,另一种常见的Cookie管理场景是在Python脚本自身的HTTP请求过程中维护Cookie。requests库的Session对象提供了强大的Cookie管理能力,它会自动在同一个会话中的请求之间持久化Cookie。

1. requests.Session 的工作原理

requests.Session对象内部包含一个CookieJar,它会在会话生命周期内自动存储和发送Cookie。当你通过Session对象发起请求时,任何响应中包含的Set-Cookie头都会被解析并添加到会话的CookieJar中,并在后续请求中自动携带这些Cookie。

2. 示例:使用 requests.Session 管理Cookie

import requests
import pprint

def manage_cookies_with_session(url: str):
    """
    使用requests.Session管理HTTP请求过程中的Cookie。
    """
    print(f"使用requests.Session访问: {url}")
    session = requests.Session()

    try:
        # 第一次请求,可能会获取到一些初始Cookie
        print("\n第一次请求...")
        response1 = session.get(url)
        print(f"状态码: {response1.status_code}")
        print("第一次请求后Session中的Cookie:")
        pprint.pprint(session.cookies.get_dict())

        # 第二次请求,会自动携带第一次请求获得的Cookie
        print("\n第二次请求...")
        response2 = session.get(url)
        print(f"状态码: {response2.status_code}")
        print("第二次请求后Session中的Cookie:")
        pprint.pprint(session.cookies.get_dict())

        # 也可以手动设置Cookie
        session.cookies.set('my_custom_cookie', 'my_value', domain='google.com')
        print("\n手动添加Cookie后Session中的Cookie:")
        pprint.pprint(session.cookies.get_dict())

        # 再次请求以验证手动添加的Cookie是否被发送
        print("\n第三次请求(带自定义Cookie)...")
        response3 = session.get(url)
        print(f"状态码: {response3.status_code}")
        print("第三次请求后Session中的Cookie:")
        pprint.pprint(session.cookies.get_dict())

    except requests.exceptions.RequestException as e:
        print(f"请求过程中发生错误: {e}")

if __name__ == "__main__":
    target_url = "https://google.com" # 替换为你想测试的URL
    manage_cookies_with_session(target_url)

代码解释:

  • requests.Session() 创建一个会话对象。
  • 通过session.get(url)或session.post(url)发起的请求,其Cookie都会由Session对象自动管理。
  • session.cookies.get_dict()可以获取当前会话中所有Cookie的字典表示。
  • session.cookies.set()可以手动向会话中添加Cookie。

适用场景: 这种方法适用于模拟用户在一次浏览器会话中的连续操作,例如登录后访问个人中心、购物车操作等。它不会去读取浏览器本地存储的Cookie,而是维护脚本自身会话中产生的Cookie。

总结

获取浏览器Cookie是Python网络编程中的一项关键技能。针对不同的需求,我们可以选择不同的方法:

  • browser_cookie3库:当你需要访问用户本地浏览器中已存储的Cookie(包括登录状态、持久化偏好等)时,这是最佳选择。它解决了跨浏览器兼容性、Cookie加密和文件路径差异等复杂问题,使得获取Chrome、Firefox、Edge等主流浏览器的Cookie变得简单。
  • requests.Session对象:当你需要在Python脚本的HTTP请求过程中自动管理Cookie(例如,在登录后维护会话状态)时,requests库内置的Session功能是理想方案。它专注于在请求之间持久化Cookie,而无需关心浏览器本地存储的细节。

选择合适的方法取决于你的具体应用场景。无论哪种方法,都请牢记在使用Cookie时遵守相关法律法规、网站的使用条款以及用户隐私原则。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

754

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

636

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

707

2023.08.11

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.7万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号