0

0

短链接怎么批量还原php_用Excel配合脚本高效处理【指南】

絕刀狂花

絕刀狂花

发布时间:2026-01-02 20:46:35

|

438人浏览过

|

来源于php中文网

原创

短链接还原需禁用cURL自动跳转,手动解析Location响应头;用PhpSpreadsheet读写Excel并限速并发防封;CLI脚本封装,支持中文列名但推荐英文键,失败URL单独记录。

短链接怎么批量还原php_用excel配合脚本高效处理【指南】

用 cURL 批量请求短链接获取跳转目标

短链接还原本质是发起 HTTP 请求并读取 Location 响应头(301/302 重定向)或最终页面 URL。PHP 中最稳妥的方式是用 curl_exec() 配合 CURLOPT_FOLLOWLOCATION = false,避免自动跳转掩盖原始重定向地址。

关键点在于禁用自动跟随,手动提取响应头:

  • CURLOPT_HEADER 设为 true,才能拿到完整响应头
  • CURLOPT_NOBODY 设为 true,只取头不取体,省带宽、提速度
  • curl_getinfo($ch, CURLINFO_REDIRECT_URL) 可能为空——它只在 CURLOPT_FOLLOWLOCATION = true 且发生跳转时有效,**不可靠**
  • 必须用 explode("\r\n\r\n", curl_exec($ch), 2) 分离响应头,再逐行解析 Location:
$ch = curl_init($short_url);
curl_setopt($ch, CURLOPT_NOBODY, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HEADER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; Linux x86_64)');

$response = curl_exec($ch);
$header = explode("\r\n\r\n", $response, 2)[0];
$location = null;
foreach (explode("\r\n", $header) as $line) {
    if (stripos($line, 'Location:') === 0) {
        $location = trim(substr($line, 9));
        break;
    }
}
curl_close($ch);

Excel 数据读取与写回:用 PhpSpreadsheet 处理 .xlsx

别用 fgetcsv() 硬啃 Excel——.xlsx 是 ZIP+XML 结构,直接解析易出错。推荐 phpoffice/phpspreadsheet,支持读写、兼容公式和多 sheet。

注意两个坑:

立即学习PHP免费学习笔记(深入)”;

PPT.AI
PPT.AI

AI PPT制作工具

下载
  • 读取时默认启用内存缓存,大批量(如 >1 万行)可能 OOM,需设 setReadDataOnly(true)
  • 写入时若原文件有样式/合并单元格,save() 会丢弃——仅还原 URL 场景下可忽略,否则得用 cloneStyle() 显式保留
  • 列名若为中文(如“短链接”),读取后直接当数组键用,无需转码;但写入新列建议用英文键(如 long_url)防乱码

并发控制与错误容错:避免被封 IP 或超时失败

一次性并发 100 个 curl 请求,多数短链服务(如 t.cn、bit.ly)会返回 429 或直接断连。必须限速:

  • usleep(200000)(200ms)间隔,比 sleep(1) 精细,100 条约 20 秒完成
  • curl_error($ch) 和 HTTP 状态码双校验:状态码非 3xx 视为失败(如 404、403、503)
  • 记录失败行号 + 原始 URL 到 failed_urls.csv,方便重试,而非中断整个流程
  • 设置 CURLOPT_CONNECTTIMEOUT = 5,防止 DNS 卡死拖垮整批

命令行一键跑完:封装成可执行脚本

把逻辑打包成 CLI 脚本,直接传 Excel 路径,输出新文件,不依赖 Web 环境:

  • 入口加 #!/usr/bin/env php,Linux/macOS 下 chmod +x restore.php 即可运行
  • $argv[1] 接收输入文件路径,basename($argv[1], '.xlsx') . '_expanded.xlsx' 自动生成输出名
  • 避免用 $_SERVER['DOCUMENT_ROOT']——CLI 下不存在,路径全用 __DIR__ 或绝对路径
  • 执行前检查扩展:extension_loaded('curl')class_exists('PhpOffice\PhpSpreadsheet\IOFactory')

真实场景中,短链接服务可能返回 200 + 页面内 JS 跳转(如微博短链),这种无法靠 header 还原,得上 headless 浏览器——但那已超出 PHP 批量处理范畴,属于另一层问题了。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1949

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

455

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

531

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

576

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

25

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号