如何批量请求多个 URL 并将结果汇总保存为 CSV 文件

花韻仙語

发布时间：2026-01-21 17:09:41

875人浏览过

来源于php中文网

原创

如何批量请求多个 URL 并将结果汇总保存为 CSV 文件

本文介绍如何将单 url 请求的 python 脚本扩展为批量处理多个 url：通过循环遍历 url 列表，逐个发起 http 请求，解析 json 响应并提取指定字段，动态累积至一个 pandas dataframe，最终统一导出为 csv 文件。

要实现对多个 URL 的自动化批量请求与结构化数据聚合，核心在于：将硬编码的单 URL 替换为 URL 列表、封装请求与解析逻辑于循环中，并使用 pd.concat()（推荐）或 DataFrame.append()（已弃用，需注意兼容性）持续合并结果。以下是优化后的完整可运行教程代码：

VWO

一个A/B测试工具

下载

import requests
import pandas as pd

# ✅ 定义待请求的 URL 列表（支持任意数量）
urls = [
    'https://ws1.postescanada-canadapost.ca/AddressComplete/Interactive/Find/v2.10/json3ex.ws?Key=TF36-KU97-AB94-ZC85&Country=CAN&SearchTerm=L2A%200A2&LanguagePreference=en&LastId=CA%7CCP%7CENG%7C0A2-L2A&SearchFor=Everything&OrderBy=UserLocation&$block=true&$cache=true',
    'https://ws1.postescanada-canadapost.ca/AddressComplete/Interactive/Find/v2.10/json3ex.ws?Key=TF36-KU97-AB94-ZC85&Country=CAN&SearchTerm=M5V%203L9&LanguagePreference=en&SearchFor=Everything&OrderBy=UserLocation&$block=true&$cache=true',
    # 可继续添加更多 URL...
]

# ✅ 统一请求头（避免重复定义）
headers = {
    'authority': 'ws1.postescanada-canadapost.ca',
    'accept': '*/*',
    'accept-language': 'en-US,en;q=0.9',
    'cache-control': 'no-cache',
    'origin': 'https://www.canadapost-postescanada.ca',
    'pragma': 'no-cache',
    'referer': 'https://www.canadapost-postescanada.ca/ac/',
    'sec-ch-ua': '"Not A(Brand";v="99", "Google Chrome";v="121", "Chromium";v="121"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
    'sec-fetch-dest': 'empty',
    'sec-fetch-mode': 'cors',
    'sec-fetch-site': 'cross-site',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Safari/537.36',
}

# ✅ 初始化空列表用于高效累积数据（比反复 append DataFrame 更快）
all_results = []

print("? 开始批量请求...")
for i, url in enumerate(urls, 1):
    print(f"  → 正在请求第 {i}/{len(urls)} 个 URL: {url[:60]}...")

    try:
        response = requests.get(url, headers=headers, timeout=15)
        response.raise_for_status()  # 自动抛出 HTTP 错误（如 404、500）

        data = response.json()
        items = data.get('Items', [])

        # ✅ 使用列表推导式高效提取字段（更简洁、更 Pythonic）
        for item in items:
            all_results.append({
                'text': item.get('Text', ''),
                'description': item.get('Description', '')
            })

    except requests.exceptions.RequestException as e:
        print(f"  ⚠️  请求失败（URL #{i}）: {e}")
        continue
    except (KeyError, ValueError) as e:
        print(f"  ⚠️  解析响应失败（URL #{i}）: {e}")
        continue

# ✅ 构建最终 DataFrame（一次性创建，性能最优）
if all_results:
    final_df = pd.DataFrame(all_results)
    # ✅ 保存为 CSV（禁用索引，确保纯数据格式）
    final_df.to_csv('address_results.csv', index=False, encoding='utf-8-sig')
    print(f"✅ 成功保存 {len(final_df)} 条记录到 address_results.csv")
else:
    print("❌ 未获取到任何有效数据，请检查 URL 或 API 响应结构。")

✅ 关键改进说明：

性能优化：避免在循环中反复调用 DataFrame.append()（Pandas ≥ 2.0 已移除该方法），改用列表累积 + 一次性 pd.DataFrame() 构造，大幅提升大数据量下的执行效率。
健壮性增强：添加 try/except 捕获网络异常（超时、连接拒绝）和 JSON 解析异常；使用 .get() 防止 KeyError；response.raise_for_status() 确保 HTTP 错误被及时发现。
可维护性提升：URL 列表清晰独立，便于维护；日志输出明确每步状态，便于调试；CSV 文件名语义化（address_results.csv）。
兼容性保障：encoding='utf-8-sig' 确保 Excel 能正确识别中文等 Unicode 字符。

? 提示：若需处理数百以上 URL，建议增加请求间隔（如 time.sleep(0.5)）以遵守服务端速率限制；生产环境还应考虑使用 requests.Session() 复用连接、添加重试机制（如 tenacity 库）及异步并发（aiohttp + asyncio）进一步提升吞吐量。

如何用Python高效提取CSV数据并自动导入Word表格

如何高效地从CSV提取数据并自动导入Word生成表格

如何在Python中高效提取CSV数据并自动导入Word文档生成表格

如何用Python自动化将CSV数据导入并嵌入Word文档表格

如何高效将CSV数据导入Word并生成表格

相关标签:

excel python html js json go windows 编码大数据 app session Python json pandas 封装 Session try 循环 append 并发异步 http 性能优化自动化 excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Pandas 中按行识别并提取重复值下一篇：Python subprocess 为什么容易阻塞？

作者最新文章

在 PHP 中嵌入 JavaScript 并正确传递 PHP 变量值的完整指南

2026-01-21 09:41

如何使用正则表达式精准提取引号内外的非空白标识符（跳过引号内空格）

2026-01-21 09:44

小红书达人种草下单平台是什么？小红书达人如何筛选？

2026-01-21 09:45

Vue-Laravel 文件上传失败：FormData 为空的完整解决方案

2026-01-21 09:59

Vue-Laravel 文件上传 FormData 为空问题的完整解决方案

2026-01-21 10:00

高效导入 MariaDB 大数据集：低内存占用的 Python 实现方案

2026-01-21 10:03

如何在 DataTables 服务端模式下正确设置默认每页显示行数

2026-01-21 10:19

Java 8 Streams 实现嵌套 Map 结构的条件过滤与键提取

2026-01-21 10:28

如何解析 Go 源文件中的 go:generate 指令

2026-01-21 10:29

Kaggle 中解决 pip 依赖冲突的正确方法：使用 legacy 解析器

2026-01-21 10:30

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

769

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

661

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

764

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

659

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1325

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

549

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

710

2023.08.11