
该错误源于在fastapi服务启动前就执行了requests.post()调用,导致客户端尝试连接尚未运行的本地服务器。正确做法是将服务启动与请求发送分离,避免自调用冲突。
在使用 FastAPI 构建本地机器学习预测服务时,一个常见却容易被忽视的问题是:将客户端请求代码与服务端定义写在同一文件中,并直接运行该文件。这正是你遇到 ConnectionError: [WinError 10061] No connection could be made... 的根本原因。
❌ 错误写法(问题所在)
你的 main.py 同时做了两件事:
- 定义并启动 FastAPI 应用(通过 uvicorn main:app --reload);
- 又在同一文件中立即发起 HTTP 请求:
# ⚠️ 错误:此段代码不应出现在 main.py 中!
import requests
f = open('test_data.json')
data = json.load(f)
response = requests.post("http://localhost:8000/predict", json=data) # ← 此时 uvicorn 尚未启动!
print(response.json())当执行 uvicorn main:app --reload 时,Python 会先导入整个模块(即执行所有顶层代码),此时 requests.post(...) 立即触发 —— 但此时 FastAPI 服务还未启动,端口 8000 处于关闭状态,系统自然拒绝连接(Windows 错误码 10061)。
✅ 正确做法:职责分离
步骤 1:精简服务文件(main.py)
只保留服务定义与路由逻辑,移除所有 requests 相关代码:
# main.py
from fastapi import FastAPI
import pickle
import numpy as np
from typing import List
app = FastAPI()
def predict(data: List[float]):
with open("model.pkl", "rb") as f:
model = pickle.load(f)
data = np.array(data).reshape(1, -1)
prediction = model.predict(data).tolist() # ✅ 转为 list,确保 JSON 可序列化
return prediction
@app.post("/predict")
def predict_route(data: List[float]):
return {"prediction": predict(data)}✅ 注意:model.predict() 返回的可能是 numpy.ndarray 或 numpy.int64,直接返回会导致 FastAPI 序列化失败。务必用 .tolist() 转为原生 Python 类型。
步骤 2:启动服务
终端中运行:
uvicorn main:app --reload --host 127.0.0.1 --port 8000
你会看到类似 INFO: Uvicorn running on http://127.0.0.1:8000 的日志 —— 此时服务已就绪。
步骤 3:独立发送请求(任选其一)
-
方式 A:使用 curl(推荐快速验证)
curl -X POST "http://127.0.0.1:8000/predict" \ -H "Content-Type: application/json" \ -d "[5.1, 3.5, 1.4, 0.2]" -
方式 B:新建 test_client.py 文件
# test_client.py import requests import json with open("test_data.json") as f: data = json.load(f) response = requests.post( "http://127.0.0.1:8000/predict", json=data, timeout=10 ) print("Status:", response.status_code) print("Response:", response.json())运行:python test_client.py
方式 C:使用 Postman / HTTPie / VS Code REST Client 插件
? 额外建议与注意事项
- ✅ 模型加载优化:当前每次请求都重新加载 .pkl 文件,性能差。应改为应用启动时一次性加载(使用 @app.on_event("startup"));
- ✅ 错误处理:添加 try/except 捕获 pickle.UnpicklingError 或 ValueError,返回友好的 HTTP 错误响应;
- ✅ 输入校验:使用 Pydantic 模型替代裸 List[float],实现字段长度、范围等强约束;
- ⚠️ Windows 防火墙/杀软干扰:极少数情况下可能拦截 127.0.0.1:8000,可临时禁用测试;
- ? localhost vs 127.0.0.1:部分 Windows 环境下 localhost 解析异常,建议统一用 127.0.0.1。
遵循“服务归服务,客户端归客户端”的原则,即可彻底规避 Max retries exceeded 和 WinError 10061。这是 FastAPI(及绝大多数 Web 框架)本地开发的标准实践。










