0

0

『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署

P粉084495128

P粉084495128

发布时间:2025-07-25 11:11:28

|

1050人浏览过

|

来源于php中文网

原创

本项目针对30种常见鱼类,通过爬取多平台图片形成含1917张图片的数据集,用PaddleHub实现分类并部署到微信小程序。先预处理数据,选ResNet50模型训练,经调参优化,用Momentum优化器、batch_size=8时效果佳。再封装模型为PaddleHub Module,借PaddleHub Serving部署,实现小程序端鱼类识别,后续计划扩充数据集与功能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

『ai达人创造营』基于paddlehub实现常见鱼类分类及微信小程序部署 - php中文网

基于PaddleHub实现常见鱼类分类及微信小程序部署

『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                

针对以上30种常见鱼类进行分类,并部署到微信小程序

一、项目背景

1.1项目由来

在菜市场或者一些美食类视频中我们经常能够看到鱼的出现,
但是由于本身不怎么做菜的原因,对于一些常见的食用鱼类并不是很熟悉,
为了能够认识这些常见鱼类,并成功购买到它们,
我们有必要对一些常见的鱼类进行准确的识别。
本项目中,我们通过爬取百度图片、百度百科、电商平台等,收集了30种常见的鱼类图片,
并部署到微信小程序,方便后续的使用

1.2微信小程序鱼类识别截图

『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                

二、数据集简介

包含30类常见鱼类,合计1917张图片,由于有部分鱼类爬取到的图片数量较少,因此每种鱼类的数据量并不是一致的。
友情提示:数据集仅供学习和个人使用
30种鱼类中英文对照字典:
{'Cuttlefish': '墨鱼', 'Turbot': '多宝鱼', 'Hairtail': '带鱼', 'Grouper': '石斑鱼', 'Saury': '秋刀鱼', 'Octopus': '章鱼', 'Red_fish': '红鱼', 'Tilapia_mossambica': '罗非鱼', 'Variegated_carp': '胖头鱼', 'Grass_Carp': '草鱼', 'Silverfish': '银鱼', 'Herring': '青鱼', 'Horsehead_fish': '马头鱼', 'Squid': '鱿鱼', 'Catfish': '鲇鱼', 'Perch': '鲈鱼', 'Abalone': '鲍鱼', 'Salmon': '鲑鱼', 'Silver_carp': '鲢鱼', 'Carp': '鲤鱼', 'Crucian_carp': '鲫鱼', 'Silvery_pomfret': '鲳鱼', 'Bream': '鲷鱼', 'Plaice': '鲽鱼', 'Parabramis_pekinensis': '鳊鱼', 'Eel': '鳗鱼', 'Yellow_croaker': '黄鱼', 'Ricefield_eel': '黄鳝', 'Snakehead': '黑鱼', 'Bibcock_fish': '龙头鱼'}

2.1.数据加载和预处理

In [1]
# 解压缩数据!unzip -oq -d images data/data103322/images.zip
           
In [2]
# 数据加载和预处理import osimport paddleimport numpy as npimport paddlehub.vision.transforms as T# 定义数据集class FishDataset(paddle.io.Dataset):
    def __init__(self, dataset_dir, transforms, mode='train'):
        # 数据集存放路径
        self.dataset_dir = dataset_dir        # 数据增强
        self.transforms = transforms        # 分类数
        self.label_lst = []
        self.num_classes= self.get_label()
        self.mode = mode        # 根据mode读取对应的数据集
        if self.mode == 'train':
            self.file = 'train_list.txt'
        elif self.mode == 'test':
            self.file = 'test_list.txt'
        else:
            self.file = 'validate_list.txt'
        self.file = os.path.join(self.dataset_dir, self.file)        with open(self.file, 'r') as f:
            self.data = f.read().split('\n')[:-1]    
    def get_label(self):
        # 获取分类数
        with open(os.path.join(dataset_dir, 'label_list.txt'), 'r') as f:
            labels = f.readlines()        for idx, label in enumerate(labels):
            dic = {}
            dic['label_name'] = label.split('\n')[0]
            dic['label_id'] = idx
            self.label_lst.append(dic)        return len(self.label_lst)    def __getitem__(self, idx):
        img_path, label = self.data[idx].split(' ')
        img_path = os.path.join(self.dataset_dir, img_path)
        im = self.transforms(img_path)        return im, int(label)    
    def __len__(self):
        return len(self.data)# 定义数据增强train_Transforms = T.Compose([
                T.Resize((256, 256)),
                T.CenterCrop(224),
                T.RandomHorizontalFlip(),
                T.Normalize()
                ], to_rgb=True)
eval_Transforms = T.Compose([
                T.Resize((256, 256)),
                T.CenterCrop(224),
                T.Normalize()
                ], to_rgb=True)# 读取数据集dataset_dir = 'images/images'fish_train = FishDataset(dataset_dir, train_Transforms)
fish_validate = FishDataset(dataset_dir, eval_Transforms, mode='validate')print('训练集的图片数量: {}'.format(len(fish_train)))print('验证集的图片数量: {}'.format(len(fish_validate)))print('分类数: {}'.format(len(fish_train.label_lst)))
           
In [3]
# label_id转labelid2label = {}for i in fish_train.label_lst:
     id2label[i['label_id']] = i['label_name']print(id2label)
           
In [4]
# 鱼类英文名转中文en2zh = {'Cuttlefish': '墨鱼', 'Turbot': '多宝鱼', 'Hairtail': '带鱼', 'Grouper': '石斑鱼', 'Saury': '秋刀鱼', 'Octopus': '章鱼', 'Red_fish': '红鱼', 'Tilapia_mossambica': '罗非鱼', 'Variegated_carp': '胖头鱼', 'Grass_Carp': '草鱼', 'Silverfish': '银鱼', 'Herring': '青鱼', 'Horsehead_fish': '马头鱼', 'Squid': '鱿鱼', 'Catfish': '鲇鱼', 'Perch': '鲈鱼', 'Abalone': '鲍鱼', 'Salmon': '鲑鱼', 'Silver_carp': '鲢鱼', 'Carp': '鲤鱼', 'Crucian_carp': '鲫鱼', 'Silvery_pomfret': '鲳鱼', 'Bream': '鲷鱼', 'Plaice': '鲽鱼', 'Parabramis_pekinensis': '鳊鱼', 'Eel': '鳗鱼', 'Yellow_croaker': '黄鱼', 'Ricefield_eel': '黄鳝', 'Snakehead': '黑鱼', 'Bibcock_fish': '龙头鱼'}print(en2zh)
           

2.2数据集查看

In [6]
from PIL import Imageimport matplotlib.pyplot as plt

path = 'images/images/train'plt.figure(figsize=(30, 8))for idx, name in enumerate(en2zh.keys()):    for fpath, dirname, fname in os.walk(os.path.join(path, name)):
        plt.subplot(3, 10, idx+1)
        img = Image.open(os.path.join(fpath, fname[0]))
        plt.title(name)
        plt.imshow(img)
           

三、模型选择和开发

3.1.模型选择

In [7]
import paddlefrom paddle.vision.models import resnet50# 设置pretrained参数为True,可以加载resnet50在imagenet数据集上的预训练模型model = paddle.Model(resnet50(pretrained=True, num_classes=len(fish_train.label_lst)))
           

3.2模型训练

In [8]
from paddle.optimizer import Momentumfrom paddle.regularizer import L2Decayfrom paddle.nn import CrossEntropyLossfrom paddle.metric import Accuracy# 配置优化器optimizer = Momentum(learning_rate=0.001,
                     momentum=0.9,
                     weight_decay=L2Decay(1e-4),
                     parameters=model.parameters())# 进行训练前准备model.prepare(optimizer, CrossEntropyLoss(), Accuracy(topk=(1, 5)))# 启动训练model.fit(fish_train,
          fish_validate,
          epochs=50,
          batch_size=8,
          save_dir="./output")
           
In [9]
if not os.path.exists('final'):
    os.mkdir('final')# 将final.pdparams复制到final文件夹!cp output/final.pdparams final
           

3.3模型评估测试

In [10]
# 模型评估,根据prepare接口配置的loss和metric进行返回result = model.evaluate(fish_validate)print(result)
           

3.4.模型预测

In [11]
# 批量预测from paddle.static import InputSpec# 加载final模型参数inputs = InputSpec([None, 1*1*3*224*224], 'float32', 'x')
labels = InputSpec([None, 30], 'int32', 'x')
model = paddle.Model(resnet50(num_classes=len(fish_train.label_lst)), inputs, labels)# 加载模型参数model.load('final/final.pdparams')# 定义优化器optimizer = Momentum(learning_rate=0.001,
                     momentum=0.9,
                     weight_decay=L2Decay(1e-4),
                     parameters=model.parameters())# 进行预测前准备model.prepare(optimizer, CrossEntropyLoss(), Accuracy(topk=(1, 5)))# 加载测试集数据fish_test = FishDataset(dataset_dir, eval_Transforms, mode='test')# 进行预测操作result = model.predict(fish_test)# 定义画图方法def show_img(idx, predict):
    with open(os.path.join(dataset_dir, 'test_list.txt')) as f:
        data = f.readlines()
    plt.figure()    print('predict: {}'.format(predict))
    img = Image.open(os.path.join(dataset_dir, data[idx].split()[0]))
    plt.imshow(img)
    plt.show()# 抽样展示indexs = [2, 15, 38, 100]for idx in indexs:
    show_img(idx, en2zh[id2label[np.argmax(result[0][idx])]])
           
In [12]
# 单张图片预测# 读取单张图片image = paddle.to_tensor(fish_test[80][0]).reshape([1, 1, 3, 224, 224])
image_id = 80# 单张图片预测result = model.predict(image)# 可视化结果show_img(image_id, en2zh[id2label[np.argmax(result)]])
           

四、基于PaddleHub Serving进行微信小程序部署

内容根据PaddleHub文档教程>如何创建自己的Module改编。文档基于情感分类(NLP)模型,本文基于(CV),开发者可根据需要相互参考。

4.1创建必要的目录和文件

在 /home/aistudio/work 目录下创建 fish_predict 文件夹,并在该目录下分别创建 module.py __init__.py ,其中 module.py 作为 Module 的入口,用来实现逻辑预测功能。

In [13]
! tree work/
           

4.2. 修改 module.py 文件

hub模型的转换基于我们在此之前写过的代码,通过对其进行包装修饰得到所需的 module.py 文件。

Face++旷视
Face++旷视

Face⁺⁺ AI开放平台

下载
查看module.py代码

4.3 安装模型及预测

在 module.py 中编写好代码后,就可以通过 hub install xxx 的方式来安装模型了!

In [14]
!pip install --upgrade paddlehub
           
In [15]
# 安装模型!hub install work/fish_predict/
           
In [16]
# 预测import paddlehub as hub
my_fish_predict = hub.Module(name="fish_predict")
my_fish_predict.fish_predict('images/images/test/Hairtail/137.jpg')
           

4.4 终端部署

部署方法:

  1. 在终端运行命令 hub serving start -m fish_predict 。如果它出现下面的提示说明部署成功『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                        

  2. 通过POST请求实现预测

In [17]
# 通过POST请求实现预测import requestsimport jsonimport cv2import base64def cv2_to_base64(image):
    data = cv2.imencode('.png', image)[1]    return base64.b64encode(data.tobytes()).decode('utf-8')# 发送HTTP请求data = {'img_b64': cv2_to_base64(cv2.imread("images/images/test/Hairtail/137.jpg"))}
headers = {"Content-type": "application/json",           "Connection": "close"}
url = "http://0.0.0.0:8866/predict/fish_predict"r = requests.post(url=url, headers=headers, data=json.dumps(data))# 打印预测结果print(r)print(r.json()['results'].encode('utf-8').decode('unicode_escape'))
           

4.5 部署到微信小程序

  • 小程序二维码

『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                

  • 效果展示

『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                

  • 相关代码
    • 小程序页面js代码『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                            
    • 服务端请求云函数代码『AI达人创造营』基于PaddleHub实现常见鱼类分类及微信小程序部署 - php中文网                            

五、总结

  1. 数据集获取
    • 初始阶段是通过在百度图片、电商平台搜索关键词,爬取返回的百度图片及产品图片,但是通过这样的方式爬取的图片,经常会在搜索的关键词中返回其他的鱼类
    • 后来则通过借鉴百度百科中所介绍的相关鱼类的信息,对爬取的图片进行人工筛选、判断,最终获取到1917张的数据集图片
    • 后续考虑需要直接去菜市场对相关鱼类进行现场拍摄,获取更准确、更丰富的数据集图片
  2. 模型调参
    • 在batch_size的选择上,初始选择了32,但是由于本身数据集不是很大,因此发现batch_size为32的训练结果较差,后续将batch_size缩减到8后,模型的收敛速度加快,模型表现也更好
    • 在优化器的选择上,选择了SGD、Momentum、Adam、Adagrad进行训练,根据最终训练结果的表现,Momentum更胜一筹,收敛速度及准确率都优于其他的优化器
  3. 后续进展
    • 本次仅针对30种较为常见的鱼类进行了分类识别,后续继续收集菜市场中常见的蔬菜、虾蟹贝类、禽畜等数据集图片,将整个模型扩充到对菜市场常见的产品的识别
    • 本次仅训练了分类模型,后续将使用Labelimg对数据集进行数据标注,便于后续训练目标检测模型
    • 本次虽然使用了微信小程序进行部署,但是微信小程序的整体页面及功能还是相对比较简陋,后续不仅在对用户传入的图片进行识别后,还应当返回相关的鱼类或其他蔬菜等的科普介绍、热门菜谱等,提升整个小程序的实用性

个人简介

我在AI Studio上获得白银等级,点亮3个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/158581

In [ ]
<br/>
           

相关文章

微信app下载
微信app下载

微信是一款手机通信软件,支持通过手机网络发送语音短信、视频、图片和文字。微信可以单聊及群聊,还能根据地理位置找到附近的人,带给大家全新的移动沟通体验,有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
微信是谁开发的
微信是谁开发的

微信是由张小龙所带领的腾讯广州研发中心产品团队打造开发的,并不是马化腾开发的,而腾讯公司总裁马化腾是在产品策划的邮件中确定这款产品的名称叫做“微信”的。想了解更多微信相关的内容,可阅读本专题下面的相关文章。

4103

2024.11.05

微信是谁开发的
微信是谁开发的

微信是由张小龙所带领的腾讯广州研发中心产品团队打造开发的,并不是马化腾开发的,而腾讯公司总裁马化腾是在产品策划的邮件中确定这款产品的名称叫做“微信”的。想了解更多微信相关的内容,可阅读本专题下面的相关文章。

4103

2024.11.05

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

70

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

109

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

326

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

62

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

105

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

108

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

236

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
微信小程序开发之API篇
微信小程序开发之API篇

共15课时 | 1.3万人学习

ECMAScript6 / ES6---十天技能课堂
ECMAScript6 / ES6---十天技能课堂

共25课时 | 2.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号