requests.get() 返回403或空响应主因是缺失User-Agent头;需设headers、检查status_code和Content-Type、加timeout;post需依数据类型选json/data/files参数;Session用于保Cookie和复用连接;HTTPS勿轻易verify=False。

requests.get() 为什么返回 403 或空响应
不是服务器拒绝你,大概率是没带 User-Agent。很多网站默认拦截 Python 的 requests 请求头,因为它太“干净”了——没有浏览器特征。
- 加个基础请求头:
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'} - 别用
requests.get(url).text直接取内容,先检查r.status_code和r.headers.get('content-type'),避免乱码或重定向陷阱 - 超时必须设:
requests.get(url, timeout=5),否则卡死在 DNS 或慢响应上
requests.post() 发不出数据?查这三处
post() 不像表单提交那么“智能”,它不会自动帮你选编码方式,发错格式服务端直接 400。
- 传 JSON 数据:用
json=参数,requests.post(url, json={'key': 'val'}),它会自动设Content-Type: application/json并序列化 - 传表单数据(
application/x-www-form-urlencoded):用data=,传字典或urllib.parse.urlencode()后的字符串 - 传原始字节或文件:用
data=+ 字节对象,或files=,此时别再设json=,二者互斥
Session 对象不是可有可无的装饰品
登录、保持 Cookie、复用连接——这些不是“高级技巧”,而是日常刚需。不用 Session,每次 get/post 都是全新 TCP 连接 + 无状态请求。
- 登录后访问需鉴权页?必须用同一个
Session实例:s = requests.Session(); s.post(login_url, data=...); s.get(profile_url) -
Session自动管理 Cookie,但不会自动处理Set-Cookie中的SameSite或Secure限制,遇到跳转后 Cookie 丢失,先看响应头 - 并发请求多时,
Session比裸调requests.get省连接、省 DNS 查询,性能差异明显
HTTPS 证书验证失败:别急着加 verify=False
加 verify=False 能跑通,但等于关掉 TLS 安全校验,中间人攻击风险实打实存在,尤其内网调试时容易养成坏习惯。
立即学习“Python免费学习笔记(深入)”;
- 真遇到自签名证书,优先配
verify='/path/to/cert.pem',而不是关验证 - 公司内网 CA 未被系统信任?把根证书加进系统证书库,或用
REQUESTS_CA_BUNDLE环境变量指向合并后的 PEM 文件 -
verify=False会触发InsecureRequestWarning,用urllib3.disable_warnings()压警告只是掩耳盗铃,不解决根本问题










