0

0

使用 Python API 获取 USDA 营养数据:突破 50 条记录的限制

霞舞

霞舞

发布时间:2025-08-28 19:04:01

|

601人浏览过

|

来源于php中文网

原创

使用 python api 获取 usda 营养数据:突破 50 条记录的限制

本文介绍了如何使用 Python 访问 USDA(美国农业部)的营养数据 API,并解决默认情况下只能获取 50 条记录的限制。通过分析 API 文档,了解分页机制和参数设置,我们将学习如何迭代所有页面,获取完整的数据集,并将其用于后续的数据分析和处理。本文提供详细的代码示例,帮助读者快速上手。

USDA 营养数据 API 访问与数据分页处理

USDA 提供了丰富的营养数据 API,允许开发者获取各种食物的营养成分信息。然而,默认情况下,API 每次只返回有限数量的记录(通常为 50 条)。为了获取更完整的数据,我们需要了解 API 的分页机制,并通过迭代分页来获取所有数据。

了解 API 分页机制

在使用任何 API 之前,务必仔细阅读其官方文档。USDA 营养数据 API 的文档明确指出,API 支持分页功能,并提供了 pageSize 和 pageNumber 两个参数来控制每页返回的记录数和要访问的页码。

  • pageSize: 指定每页返回的记录数。默认值为 50,最大值可以设置为 200。
  • pageNumber: 指定要访问的页码。

通过调整这两个参数,我们可以控制每次请求返回的数据量和要访问的页面。

立即学习Python免费学习笔记(深入)”;

实现分页数据获取

以下代码展示了如何使用 Python 的 requests 库和 json 库来访问 USDA 营养数据 API,并实现分页数据获取:

燕雀Logo
燕雀Logo

为用户提供LOGO免费设计在线生成服务

下载
import requests
import json
import pandas as pd

def call_API(foodName, apiKey):
    foods = []
    url = f"https://api.nal.usda.gov/fdc/v1/foods/search?api_key={apiKey}&query={foodName}&pageSize=200"
    with requests.Session() as req:
        try:
            r = req.get(url, timeout=10)
            r.raise_for_status()
        except requests.exceptions.HTTPError as err:
            print(f"Error: {err}")
            return None
        api_response = r.json()
        foods.extend(api_response["foods"])
        for page in range(2, api_response["totalPages"] + 1):
            try:
                r = req.get(url + f"&pageNumber={page}", timeout=10)
                r.raise_for_status()
            except requests.exceptions.HTTPError as err:
                print(f"Error: {err}")
                break
            api_response = r.json()
            foods.extend(api_response["foods"])
    return foods

food_items = call_API("raw", "YOUR_API_KEY")

# 示例:打印前5个食物的描述
if food_items:
    for i in range(min(5, len(food_items))):
        print(f"Food {i+1}: {food_items[i]['description']}")
else:
    print("No food items found.")

代码解释:

  1. call_API(foodName, apiKey) 函数:

    • 接受食物名称 foodName 和 API 密钥 apiKey 作为参数。
    • 初始化一个空列表 foods 用于存储所有食物数据。
    • 构建 API 请求 URL,设置 pageSize 为 200 以获取最大数量的记录。
    • 使用 requests.Session() 管理 HTTP 会话,提高效率。
    • 使用 try...except 块处理可能的 HTTP 错误。
    • 从 API 响应中提取 totalPages,确定需要迭代的页数。
    • 使用循环迭代所有页面,构建新的 API 请求 URL,并添加 pageNumber 参数。
    • 将每页获取的食物数据添加到 foods 列表中。
    • 返回包含所有食物数据的 foods 列表。
  2. 主程序:

    • 调用 call_API() 函数,获取所有食物数据。
    • 遍历 food_items 列表,打印每个食物的描述信息。

注意事项

  • API 密钥安全: 请务必妥善保管您的 API 密钥,不要将其泄露给他人。建议将 API 密钥存储在环境变量中,并在代码中读取环境变量。
  • 错误处理: 在实际应用中,需要完善错误处理机制,例如处理网络连接错误、API 响应格式错误等。
  • API 调用频率限制: 某些 API 可能会对调用频率进行限制。请注意遵守 API 的使用条款,避免过度调用。
  • 数据格式: USDA API 返回的数据是 JSON 格式。需要使用 json 库将其解析为 Python 对象,方便后续处理。

总结

通过本文的学习,您应该掌握了如何使用 Python 访问 USDA 营养数据 API,并解决默认情况下只能获取 50 条记录的限制。通过了解 API 的分页机制,并编写相应的代码,您可以获取更完整的数据集,为后续的数据分析和处理奠定基础。 请记住,在实际应用中,需要根据具体需求进行调整和优化,并注意 API 密钥安全、错误处理和 API 调用频率限制等问题。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

419

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

535

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

session失效的原因
session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍:1、会话超时:服务器为Session设置了一个默认的超时时间,当用户在一段时间内没有与服务器交互时,Session将自动失效;2、会话数量限制:服务器为每个用户的Session数量设置了一个限制,当用户创建的Session数量超过这个限制时,最新的会覆盖最早的等等。

315

2023.10.17

session失效解决方法
session失效解决方法

session失效通常是由于 session 的生存时间过期或者服务器关闭导致的。其解决办法:1、延长session的生存时间;2、使用持久化存储;3、使用cookie;4、异步更新session;5、使用会话管理中间件。

750

2023.10.18

cookie与session的区别
cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容,阅读专题下面的文章了解更详细的内容。

93

2025.08.19

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

421

2023.11.09

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

17

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号