PyTorch 中的 EMNIST

花韻仙語

发布时间：2024-12-05 17:03:12

889人浏览过

来源于dev.to

转载

请我喝杯咖啡☕

*我的帖子解释了 emnist。

emnist()可以使用emnist数据集，如下所示：

*备忘录：

SnapEdit

AI移除图片中的任何物体

下载

第一个参数是 root（必需类型：str 或 pathlib.path）。 *绝对或相对路径都是可能的。
第二个参数是 split(required-type:str)。 *可以设置“byclass”、“bymerge”、“balanced”、“letters”、“digits”或“mnist”。
有训练参数（可选-默认：false-类型：float）： *备注：
- 对于 split="byclass" 和 split="byclass"，如果为 true，则使用训练数据（697,932 张图像），如果为 false，则使用测试数据（116,323 张图像）。
- 对于 split="balanced"，如果为 true，则使用训练数据（112,800 张图像），如果为 false，则使用测试数据（188,00 张图像）。
- 对于 split="letters"，如果为 true，则使用训练数据（124124,800 张图像），如果为 false，则使用测试数据（20,800 张图像）。
- 对于 split="digits"，如果为 true，则使用训练数据（240,000 张图像），如果为 false，则使用测试数据（40,000 张图像）。
- 对于 split="mnist"，如果为 true，则使用训练数据（60,000 张图像），如果为 false，则使用测试数据（10,000 张图像）。
有转换参数（可选-默认：无-类型：可调用）。
有 target_transform 参数（可选-默认：无-类型：可调用）。
有下载参数（可选-默认：false-类型：bool）： *备注：
- 如果为 true，则从互联网下载数据集并解压（解压）到根目录。
- 如果为 true 并且数据集已下载，则将其提取。
- 如果为 true 并且数据集已下载并提取，则不会发生任何事情。
- 如果数据集已经下载并提取，则应该为 false，因为它速度更快。
- 您可以从此处手动下载并提取数据集，例如数据/emnist/raw/.
存在图像默认翻转并逆时针旋转90度的错误，因此需要对其进行转换。

from torchvision.datasets import emnist

train_data = emnist(
    root="data",
    split="byclass"
)

train_data = emnist(
    root="data",
    split="byclass",
    train=true,
    transform=none,
    target_transform=none,
    download=false
)

test_data = emnist(
    root="data",
    split="byclass",
    train=false
)

len(train_data), len(test_data)
# 697932 116323

train_data
# dataset emnist
#     number of datapoints: 697932
#     root location: data
#     split: train

train_data.root
# 'data'

train_data.split
# 'byclass'

train_data.train
# true

print(train_data.transform)
# none

print(train_data.target_transform)
# none

train_data.download
# 

train_data[0]
# (, 35)

train_data[1]
# (, 36)

train_data[2]
# (, 6)

train_data[3]
# (, 3)

train_data[4]
# (, 22)

train_data.classes
# ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
#  'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
#  'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z',
#  'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
#  'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']

from torchvision.datasets import emnist

train_data = emnist(
    root="data",
    split="byclass",
    train=true
)

test_data = emnist(
    root="data",
    split="byclass",
    train=false
)

import matplotlib.pyplot as plt

def show_images(data):
    plt.figure(figsize=(12, 2))
    col = 5
    for i, (image, label) in enumerate(data, 1):
        plt.subplot(1, col, i)
        plt.title(label)
        plt.imshow(image)
        if i == col:
            break
    plt.show()

show_images(data=train_data)
show_images(data=test_data)

PyTorch 中的 EMNIST

from torchvision.datasets import EMNIST
from torchvision.transforms import v2

train_data = EMNIST(
    root="data",
    split="byclass",
    train=True,
    transform=v2.Compose([
        v2.RandomHorizontalFlip(p=1.0),
        v2.RandomRotation(degrees=(90, 90))
    ])
)

test_data = EMNIST(
    root="data",
    split="byclass",
    train=False,
    transform=v2.Compose([
        v2.RandomHorizontalFlip(p=1.0),
        v2.RandomRotation(degrees=(90, 90))
    ])
)

import matplotlib.pyplot as plt

def show_images(data):
    plt.figure(figsize=(12, 2))
    col = 5
    for i, (image, label) in enumerate(data, 1):
        plt.subplot(1, col, i)
        plt.title(label)
        plt.imshow(image)
        if i == col:
            break
    plt.show()

show_images(data=train_data)
show_images(data=test_data)

PyTorch 中的 EMNIST

PythonAI实战驱动学习教程_边做项目边成长

PythonAI初学者避坑教程_转型过程中常见错误

Python持续集成高级教程_测试覆盖率与发布流程实践

ZSH 提示符中动态条件显示 Git 分支与虚拟环境信息的完整教程

如何在 ZSH 提示符中动态条件显示 Git 分支与虚拟环境信息

相关专题

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

579

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

102

2025.10.23

css中float用法

579

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

102

2025.10.23

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

433

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

clawdbot ai使用教程保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手，可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等，并且可以接入用户常用的任何聊天APP，所有的操作均可通过WhatsApp、Telegram等平台完成，用户只需通过对话，就能操控设备自动执行各类任务。

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手，可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等，并且可以接入用户常用的任何聊天APP，所有的操作均可通过WhatsApp、Telegram等平台完成，用户只需通过对话，就能操控设备自动执行各类任务。

2026.01.29

Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用，包括对称加密与非对称加密（AES、RSA）、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范（如SQL注入、XSS、CSRF）及其防护措施。通过实战案例，帮助学习者掌握如何使用 Go 语言保障网络通信的安全性，保护用户数据与隐私。

2026.01.29

热门下载

网站特效

网站源码

网站素材

前端模板