爬虫如何设置延迟_PHP控制请求频率防封方法【技巧】

雪夜

发布时间：2026-02-09 10:27:21

208人浏览过

来源于php中文网

原创

PHP爬虫需用microtime()精准控制请求间隔而非sleep()，并配合UA轮换、Referer模拟、禁用连接复用等措施，否则易被风控识别封禁。

爬虫如何设置延迟_php控制请求频率防封方法【技巧】

PHP爬虫不加延迟，基本等于主动触发反爬机制——绝大多数目标站的风控系统会在几秒内识别并封禁IP。

为什么 sleep() 不够用

单纯在每次请求后 sleep(1) 只能控制本进程的节奏，但无法应对并发请求、DNS缓存复用、TCP连接复用等真实网络行为。更关键的是：很多站点会统计单位时间内的请求数（如 10 秒内超 20 次即限流），而 sleep() 无法保证请求时间点均匀分布，容易形成“请求簇”，反而更易被识别。

多个 cURL 请求若共享同一个 CURLOPT_TCP_KEEPALIVE 连接池，实际发出时间可能集中在毫秒级窗口内
使用 file_get_contents() 时，PHP 默认不复用连接，但 DNS 解析可能被系统缓存，导致后续请求瞬间爆发
没考虑服务器响应时间波动——如果某次请求耗时 800ms，sleep(1) 后下一次请求实际间隔仅 200ms

用 microtime() 实现精准间隔控制

真正可控的方式是按“上一次请求发起时间 + 固定间隔”来调度下一次请求，而不是依赖上一次请求结束时间。核心是记录 microtime(true) 时间戳，再计算等待时长。

$min_interval = 1.5; // 最小间隔 1.5 秒
$last_request_time = 0;
function request_with_delay($url) {
global $last_request_time, $min_interval;
$now = microtime(true);
$delay = $last_request_time + $min_interval - $now;
if ($delay > 0) {
    usleep((int)($delay * 1000000));
}

$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT_MS, 5000);
curl_setopt($ch, CURLOPT_TIMEOUT_MS, 10000);
$result = curl_exec($ch);
curl_close($ch);

$last_request_time = microtime(true); // 记录发起时间，非完成时间
return $result;
}
立即学习“PHP免费学习笔记（深入）”；
注意：这里用的是 curl_init() 发起时刻作为锚点，不是 curl_exec() 返回时刻，才能避免响应延迟导致的节奏偏移。

							
								
								
									OmniAudio
									OmniAudio 是一款通过 AI 支持将网页、Word 文档、Gmail 内容、文本片段、视频音频文件都转换为音频播客，并生成可在常见 Podcast ap
								
								下载 
							
						
配合 User-Agent 轮换与 Referer 模拟才真正有效
只控频不伪装，照样会被标记为爬虫。频率控制只是基础层，必须叠加请求头真实性：

每次请求前从数组中随机选一个 User-Agent 字符串，避免固定值被指纹识别
设置 Referer 为该目标站的首页或上一级页面（如爬 /list/123，Referer 设为 https://example.com/list/）
禁用 Accept-Encoding: gzip 或手动解压，某些 WAF 会检测压缩头异常
避免连续使用同一 Cookie，必要时调用 session_start() 并清理 $_COOKIE


别忽略 DNS 和连接复用带来的隐性并发
PHP 的 cURL 默认启用 CURLOPT_TCP_KEEPALIVE（7.25.0+），且 DNS 缓存由系统或 cURL 自身管理。这意味着即使你单线程跑，也可能因复用连接造成服务端看到“短时高频”流量。
稳妥做法是显式关闭复用：
curl_setopt($ch, CURLOPT_FORBID_REUSE, true);
curl_setopt($ch, CURLOPT_FRESH_CONNECT, true);
curl_setopt($ch, CURLOPT_DNS_CACHE_TIMEOUT, 0);
同时，如果用 curl_multi_exec() 做并发采集，必须配合信号量或队列控制总并发数 ≤ 1，否则所有前面的延迟逻辑都失效。
真正难的不是写个 sleep()，而是让每一次请求在网络层、应用层、语义层都像真实用户——延迟只是其中一环，漏掉任意一层，封禁只是时间问题。

PHP获取域名含参数怎么去掉参数_PHP域名去参数保留主域【方法】

PHP时区设置全球时间怎么办_多时区转换的实现方法【教程】

高频用PHP静态在哪_PHP静态在工具类单例中的实用场景【技巧】

php怎么部署线上博客_用laravel框架要配哪些扩展才稳【详解】

PHP时区设置和JavaScript时区同步_前后端时间统一方法【教程】

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php cookie session curl 解压爬虫 dns 并发请求为什么 Cookie cURL 字符串线程并发 https

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：PHP怎么读取Excel文件内容_PHP解析Excel表格数据教程【方法】下一篇：暂无

作者最新文章

猿辅导2026最新版官网入口_猿辅导官方正版访问

2026-02-06 17:26

智学网手机登录入口智学网个人成绩查询手机端入口

2026-02-06 17:27

INMOGO2怎样开隐私模式_INMOGO2开隐私模式步骤【私密】

2026-02-06 17:31

免费AI助手回答慢怎提速_免费AI助手提速技巧【加速】

2026-02-06 17:39

雷鸟Air2怎样设快捷启动键_雷鸟Air2快捷键设置法【便捷】

2026-02-06 17:41

人人视频会员领取老号能用吗_人人视频app新老号领取差异【详解】

2026-02-06 17:52

雷鸟AirPlus怎样装近视镜片_雷鸟AirPlus镜架加镜法【适配】

2026-02-06 17:55

作业帮app直播课卡顿如何解决_作业帮app课堂流畅观看操作【指南】

2026-02-06 17:56

还在手动设闹钟？鸿蒙 6 日历帮你轻松搞定春运抢票与年货抢购

2026-02-06 18:32

智学网能否多设备同时登录_智学网账号并发使用介绍【介绍】

2026-02-06 18:53

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Cookie 是一种在用户计算机上存储小型文本文件的技术，用于在用户与网站进行交互时收集和存储有关用户的信息。当用户访问一个网站时，网站会将一个包含特定信息的 Cookie 文件发送到用户的浏览器，浏览器会将该 Cookie 存储在用户的计算机上。之后，当用户再次访问该网站时，浏览器会向服务器发送 Cookie，服务器可以根据 Cookie 中的信息来识别用户、跟踪用户行为等。

6447

2023.06.30