
1. 概述
在使用yolov8进行关键点检测时,常见的需求是能够上传自定义图片,然后让模型对其进行推理,并最终展示带有关键点标注的输出图像。许多初学者可能会遇到推理成功但无法直接显示带有标注的输出图像的问题。本教程将详细介绍如何在google colab等环境中实现这一完整流程。
2. 环境准备与模型加载
在开始之前,请确保您的环境中已安装YOLOv8及其依赖,并且已加载或训练好一个用于关键点检测的YOLOv8模型。
# 确保已安装ultralytics库
# !pip install ultralytics
from ultralytics import YOLO
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import os
from google.colab import files # 仅适用于Google Colab环境
# 加载预训练的关键点检测模型
# 您可以使用YOLOv8提供的预训练模型,例如yolov8n-pose.pt
# 或者您自己训练的模型
model = YOLO('yolov8n-pose.pt')
print("YOLOv8模型加载成功。")3. 图像上传功能实现
在Google Colab环境中,google.colab.files.upload()函数提供了一个便捷的上传文件接口。用户可以通过浏览器选择本地图片上传到Colab会话中。
def upload_image():
"""
在Google Colab环境中上传图片,并返回上传图片的路径。
"""
uploaded = files.upload()
for filename in uploaded.keys():
print(f'用户已上传文件: {filename}')
return filename # 通常只处理一个文件
return None
# 调用上传函数
uploaded_image_path = upload_image()
if uploaded_image_path:
print(f"准备处理图片: {uploaded_image_path}")
else:
print("未上传图片。")注意事项:
- files.upload()会返回一个字典,键为文件名,值为文件内容。这里我们假设只上传一张图片,并取第一个文件名。
- 上传的文件会存储在Colab会话的当前工作目录中。
- 如果在本地环境运行,您需要使用其他方法(如input()获取路径,或直接指定图片路径)来获取输入图像。
4. YOLOv8关键点推理与结果保存
YOLOv8的model()方法用于执行推理。关键在于设置save=True参数。当save=True时,模型不仅会执行推理,还会将带有关键点标注的图像保存到指定的输出目录中。
def run_inference_and_save(image_path, model):
"""
对上传的图片运行YOLOv8关键点检测推理,并保存结果。
"""
if not image_path or not os.path.exists(image_path):
print(f"错误:图片路径无效或文件不存在: {image_path}")
return None
print(f"正在对图片 '{image_path}' 进行推理...")
# 运行推理,并设置 save=True 以保存带标注的图片
results = model(image_path, save=True, conf=0.25) # conf参数可调整检测置信度阈值
# YOLOv8通常将结果保存在 runs/pose/predict/ 目录下
# 如果是第一次运行,目录可能是 predict,第二次是 predict2,以此类推
# 我们可以通过 results[0].save_dir 获取实际的保存目录
if results and len(results) > 0:
save_dir = results[0].save_dir
# 结果图像的名称通常与输入图像相同
output_image_name = os.path.basename(image_path)
processed_image_path = os.path.join(save_dir, output_image_name)
print(f"处理后的图片已保存至: {processed_image_path}")
return processed_image_path
else:
print("推理未生成任何结果。")
return None
# 执行推理并获取处理后图片的路径
processed_image_path = run_inference_and_save(uploaded_image_path, model)关键点:
- save=True:这是确保模型将带标注的图像保存到磁盘的关键参数。
- results[0].save_dir:YOLOv8在运行推理时,会将结果(包括保存的图像)放置在一个动态生成的目录下,例如runs/pose/predict或runs/pose/predict2等。通过访问results对象,我们可以准确获取到这个保存目录。
- 输出图像的文件名通常与输入图像的文件名保持一致。
5. 可视化处理后的关键点图像
一旦带有关键点标注的图像被保存到磁盘,我们就可以使用matplotlib库来加载并显示它。
def display_image(image_path, title="关键点检测结果"):
"""
使用matplotlib显示图片。
"""
if not image_path or not os.path.exists(image_path):
print(f"错误:无法显示图片,路径无效或文件不存在: {image_path}")
return
print(f"正在显示图片: {image_path}")
img = mpimg.imread(image_path)
plt.figure(figsize=(10, 8))
plt.imshow(img)
plt.title(title)
plt.axis('off') # 不显示坐标轴
plt.show()
# 显示处理后的关键点图像
if processed_image_path:
display_image(processed_image_path, "YOLOv8 关键点检测结果")
else:
print("无法显示处理后的图片,因为推理未成功或未保存图片。")6. 完整流程示例
将上述步骤整合,即可形成一个完整的图像上传、推理与可视化工作流。
import os
from ultralytics import YOLO
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from google.colab import files # 仅适用于Google Colab
# --- 1. 模型加载 ---
model = YOLO('yolov8n-pose.pt') # 替换为您自己的模型路径
# --- 2. 图像上传 ---
def upload_image_colab():
uploaded = files.upload()
if uploaded:
filename = list(uploaded.keys())[0]
print(f'用户已上传文件: {filename}')
return filename
return None
uploaded_image_path = upload_image_colab()
if uploaded_image_path:
# --- 3. YOLOv8推理与结果保存 ---
print(f"正在对图片 '{uploaded_image_path}' 进行推理...")
results = model(uploaded_image_path, save=True, conf=0.25)
processed_image_path = None
if results and len(results) > 0:
save_dir = results[0].save_dir
output_image_name = os.path.basename(uploaded_image_path)
processed_image_path = os.path.join(save_dir, output_image_name)
print(f"处理后的图片已保存至: {processed_image_path}")
else:
print("推理未生成任何结果。")
# --- 4. 可视化处理后的图像 ---
if processed_image_path and os.path.exists(processed_image_path):
print(f"正在显示图片: {processed_image_path}")
img = mpimg.imread(processed_image_path)
plt.figure(figsize=(10, 8))
plt.imshow(img)
plt.title("YOLOv8 关键点检测结果")
plt.axis('off')
plt.show()
else:
print("无法显示处理后的图片,文件不存在或路径错误。")
else:
print("未上传图片,无法进行推理。")
7. 注意事项
- 路径管理: 在Google Colab中,文件通常上传到/content/目录下。YOLOv8的输出通常在runs/pose/predict/目录下。确保在访问文件时使用正确的相对或绝对路径。
- 重复运行: 如果您多次运行推理代码,YOLOv8可能会创建新的predict目录,例如predict、predict2、predict3等。使用results[0].save_dir可以确保您总是获取到当前推理结果的正确保存目录。
- 模型选择: 确保您加载的模型是针对关键点检测任务(例如yolov8n-pose.pt)。
- 置信度阈值: conf参数(例如conf=0.25)可以调整检测结果的置信度阈值。较低的值可能会显示更多但可能不准确的关键点,较高的值会更严格。
- 错误处理: 在实际应用中,应添加更健壮的错误处理机制,例如检查文件是否存在、模型是否成功加载、推理是否返回有效结果等。
- 多图像处理: 如果需要处理多张上传图片,您需要修改上传逻辑以获取所有上传的图片路径,并循环调用推理和显示函数。
8. 总结
通过本教程,您应该已经掌握了在YOLOv8关键点检测项目中实现图像上传、执行模型推理并可视化带有关键点标注的输出图像的完整流程。核心在于理解model()方法中的save=True参数以及如何通过results对象获取保存结果的路径。这一流程对于开发交互式关键点检测应用或进行快速原型验证至关重要。










