0

0

PHP curl_multi 并发请求性能优化指南

心靈之曲

心靈之曲

发布时间:2025-08-14 22:44:16

|

458人浏览过

|

来源于php中文网

原创

PHP curl_multi 并发请求性能优化指南

本文深入探讨了PHP中利用curl_multi进行并发HTTP请求时常见的性能瓶颈及优化策略。针对curl_multi_select函数在PHP中可能存在的非阻塞行为和超时参数不生效的问题,文章详细阐述了如何构建健壮的双循环结构来高效管理并发请求,避免不必要的等待时间,确保请求处理流程尽可能快地完成。通过提供优化的代码示例和关键注意事项,帮助开发者实现高性能、高可靠的并发请求处理。

1. 理解 curl_multi 的并发机制

curl_multi 是 php 中用于并行执行多个 curl 请求的强大工具。它通过一个主句柄(multi handle)管理多个独立的 curl 句柄(individual handle),从而允许应用程序同时发起并处理多个 http 请求,显著提高数据抓取或 api 调用的效率。其基本工作流程是:初始化一个 curl_multi 句柄,添加所有待处理的 curl 句柄,然后在一个循环中反复调用 curl_multi_exec 来执行请求,并使用 curl_multi_select 来等待 i/o 活动。

2. curl_multi_select 的行为与性能挑战

在 curl_multi 的循环中,curl_multi_exec 函数负责执行请求,而 curl_multi_select 函数则用于等待套接字活动,即等待某个 cURL 句柄完成数据传输或有新的数据可读写。理想情况下,curl_multi_select 应该阻塞执行,直到有活动发生或达到指定的超时时间。然而,在某些 PHP 版本或特定环境下,curl_multi_select 可能表现为非阻塞(即立即返回),或者其超时参数(如 0.05 秒)并未被完全尊重。

当 curl_multi_select 无法有效阻塞时,即使没有 I/O 活动,循环也会频繁地空转,导致 CPU 占用率升高,并且在两次有效的请求处理之间产生不必要的延迟,从而影响整体性能。这使得开发者难以判断请求是否以最快速度完成,以及是否存在“浪费时间”的情况。

3. 健壮的 curl_multi 循环结构

为了克服 curl_multi_select 的潜在行为问题,并确保并发请求的高效处理,推荐采用一个包含两个嵌套循环的结构。这种结构能够更精确地控制请求的执行和等待逻辑,避免空转。

<?php

/**
 * 模拟创建多个 cURL 句柄
 * @param array $urls 待请求的 URL 数组
 * @return array cURL 句柄数组
 */
function createCurlHandles(array $urls): array
{
    $handles = [];
    foreach ($urls as $url) {
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_HEADER, 0);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
        // 设置一个合理的超时,防止单个请求长时间阻塞
        curl_setopt($ch, CURLOPT_TIMEOUT, 10); 
        $handles[] = $ch;
    }
    return $handles;
}

// 示例 URL 列表
$urls = [
    'https://www.example.com',
    'https://www.google.com',
    'https://www.github.com',
    'https://www.baidu.com',
    'https://www.bing.com',
];

$curlHandles = createCurlHandles($urls);

// 1. 初始化 multi cURL 句柄
$mh = curl_multi_init();

// 2. 将所有 cURL 句柄添加到 multi 句柄中
foreach ($curlHandles as $ch) {
    curl_multi_add_handle($mh, $ch);
}

$running = null;
$startTime = microtime(true);

// 3. 主循环:执行并管理并发请求
do {
    // 执行 cURL 请求,返回正在运行的句柄数量
    // curl_multi_exec 应该被反复调用,直到所有请求完成
    $mrc = curl_multi_exec($mh, $running);

    // 检查是否有错误发生
    if ($mrc != CURLM_OK) {
        // 可以根据实际情况抛出异常或记录错误
        error_log("curl_multi_exec error: " . curl_multi_strerror($mrc));
        break; // 退出循环
    }

    // 如果没有正在运行的句柄,则所有请求已完成,退出循环
    if ($running == 0) {
        break;
    }

    // 内部循环:等待 I/O 活动
    // 设定一个合理的等待时间,例如 1 秒
    // 0.05 秒可能太短,导致频繁空转;1 秒可以减少 CPU 占用
    $selectTimeout = 1.0; 

    // 如果没有活动,curl_multi_select 返回 0。如果返回 -1 表示错误。
    // 循环直到有活动或超时,避免忙等
    while (true) {
        $selectResult = curl_multi_select($mh, $selectTimeout);

        if ($selectResult === 0) {
            // 没有活动,且达到了 $selectTimeout,为了避免 CPU 忙等,可以稍微暂停
            // 注意:如果 curl_multi_select 实际不阻塞,usleep 是必要的
            usleep(10000); // 暂停 10 毫秒,减少 CPU 占用
            break; // 跳出内层循环,让外层循环再次调用 curl_multi_exec
        } elseif ($selectResult === -1) {
            // select 错误
            $multiErrno = curl_multi_errno($mh);
            error_log("curl_multi_select error: " . curl_multi_strerror($multiErrno));
            break 2; // 退出内外层循环
        } else {
            // 有活动发生($selectResult > 0),可以继续执行 curl_multi_exec
            break; 
        }
    }

} while ($running > 0); // 只要还有请求在运行,就继续循环

$endTime = microtime(true);
echo "所有请求完成,耗时: " . round($endTime - $startTime, 4) . " 秒\n";

// 4. 获取结果并清理句柄
$results = [];
foreach ($curlHandles as $ch) {
    $results[curl_getinfo($ch, CURLINFO_EFFECTIVE_URL)] = curl_multi_getcontent($ch);
    curl_multi_remove_handle($mh, $ch);
    curl_close($ch);
}

curl_multi_close($mh);

// 打印部分结果以验证
// foreach ($results as $url => $content) {
//     echo "URL: " . $url . ", Content Length: " . strlen($content) . "\n";
// }

?>

4. 代码解析与注意事项

  1. 外层 do...while ($running > 0) 循环:

    立即学习PHP免费学习笔记(深入)”;

    • 这个循环是整个并发处理的核心。它会持续执行,直到 curl_multi_exec 返回 running 变量为 0,表示所有 cURL 句柄都已完成其传输任务。
    • curl_multi_exec($mh, $running): 这是关键函数。它尝试执行所有在 multi 句柄中的 cURL 请求。$running 变量会实时更新为当前仍在进行中的请求数量。
    • 错误检查:$mrc != CURLM_OK 用于捕获 curl_multi_exec 自身的错误。
  2. 内层 while (true) 循环与 curl_multi_select:

    Peppertype.ai
    Peppertype.ai

    高质量AI内容生成软件,它通过使用机器学习来理解用户的需求。

    下载
    • 目的:此内部循环的目的是在没有 I/O 活动时,避免外层循环的忙等(busy-waiting)。它负责等待网络活动,或者在指定超时后继续。
    • curl_multi_select($mh, $selectTimeout): 这是等待 I/O 活动的函数。
      • 如果它返回 > 0,表示有句柄准备好进行 I/O 操作(例如,数据已到达或可以发送)。此时应立即跳出内层循环,让外层循环再次调用 curl_multi_exec 来处理这些活动。
      • 如果返回 0,表示在 $selectTimeout 时间内没有检测到任何活动。这可能是 curl_multi_select 非阻塞行为的表现,或者确实没有活动。在这种情况下,为了防止 CPU 占用过高,我们应该使用 usleep() 暂停一小段时间。
      • 如果返回 -1,表示 select 操作本身发生了错误。应进行错误处理并退出。
    • usleep($selectTimeout * 1000000): 如果 curl_multi_select 返回 0(无活动),并且我们希望避免 CPU 忙等,可以引入 usleep。usleep 的参数是微秒,所以 $selectTimeout 乘以 1000000 转换为微秒。在示例中,我将其改为一个较小的固定值 10000 微秒(10毫秒),以在没有活动时提供一个短暂的暂停,避免过于频繁的空转,同时保持响应性。
  3. 超时参数的权衡:

    • curl_multi_select 的超时参数 ($selectTimeout) 需要仔细权衡。如果设置过小(如 0.05 秒),在没有活动时可能导致频繁的 select 调用和 usleep,增加上下文切换开销。如果设置过大,可能会在有活动时延迟 curl_multi_exec 的调用,从而增加整体完成时间。
    • 考虑到 PHP 中 curl_multi_select 的行为不确定性,一个较长的 $selectTimeout (例如 1.0 秒) 配合 usleep 在 selectResult === 0 时短暂暂停,是一个比较稳健的策略。
  4. 错误处理:

    • 务必对 curl_multi_exec 和 curl_multi_select 的返回值进行检查。使用 curl_multi_strerror() 获取详细的错误信息,并根据业务需求进行日志记录或异常抛出。
  5. 资源清理:

    • 在所有请求完成后,必须调用 curl_multi_remove_handle() 从 multi 句柄中移除每个 cURL 句柄,并调用 curl_close() 关闭每个独立的 cURL 句柄,最后调用 curl_multi_close() 关闭 multi 句柄,以释放系统资源。

5. 总结

通过采用上述的双循环结构,开发者可以更有效地管理 PHP 中的 curl_multi 并发请求。这种方法解决了 curl_multi_select 可能存在的非阻塞问题,通过在无活动时引入短暂的 usleep 来避免 CPU 忙等,从而确保请求处理的效率和系统的稳定性。虽然 API 自身的响应速度和网络延迟是影响总耗时的主要因素,但优化 curl_multi 的循环逻辑能够最大限度地减少客户端侧的等待时间,使并发请求尽可能快地完成。在实际应用中,还需根据具体的网络环境、API 特性以及服务器资源,对超时参数和 usleep 时间进行适当的调整和测试。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

107

2023.09.25

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

455

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

498

2023.11.09

http请求415错误怎么解决
http请求415错误怎么解决

解决方法:1、检查请求头中的Content-Type;2、检查请求体中的数据格式;3、使用适当的编码格式;4、使用适当的请求方法;5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容,可以阅读下面的文章。

453

2023.11.14

HTTP 503错误解决方法
HTTP 503错误解决方法

HTTP 503错误表示服务器暂时无法处理请求。想了解更多http错误代码的相关内容,可以阅读本专题下面的文章。

3630

2024.03.12

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2927

2024.08.16

PHP 高并发与性能优化
PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优,内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例(如高并发接口优化、缓存系统设计、秒杀活动实现),帮助学习者掌握 构建高性能PHP后端系统的核心能力。

114

2025.10.16

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 4.2万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.6万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 94人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号