宝塔面板无法直接显示SSD寿命,但可通过smartctl命令、自定义监控脚本、I/O行为分析及DiskInfo工具实现寿命监控。具体包括:一、用smartctl读取Percentage Used和Data Units Written;二、配置定时脚本写入日志并可视化;三、结合宝塔I/O监控识别高await、高%util等风险信号;四、部署DiskInfo服务获取剩余寿命与TBW估算。

如果您在宝塔面板中观察到磁盘 I/O 延迟升高、写入响应变慢或日志频繁报错,可能并非仅由瞬时负载引起,而是 SSD 写入寿命临近耗尽的早期征兆。宝塔面板本身不直接提供 SSD 寿命百分比或 TBW(Total Bytes Written)读取功能,但可通过集成系统级工具与手动命令实现对磁盘写入寿命状态的有效监控。以下是多种可行方法:
一、使用 smartctl 命令读取 NVMe/SATA SSD 寿命指标
该方法依赖 smartmontools 工具,直接从 SSD 固件中提取厂商定义的寿命参数,包括 Percentage Used(寿命消耗百分比)和 Data Units Written(累计写入量),适用于绝大多数支持 S.M.A.R.T. 的 NVMe 与 SATA SSD。
1、通过 SSH 登录服务器,执行以下命令安装 smartmontools(如未安装):
sudo apt update && sudo apt install smartmontools -y(Debian/Ubuntu)
或
sudo yum install smartmontools -y(CentOS/RHEL)
2、确认 SSD 设备路径:
sudo lsblk -d -o NAME,ROTA,MODEL,SIZE(查找 ROTA=0 的设备,即非机械硬盘)
3、对目标设备(如 /dev/nvme0n1 或 /dev/sda)执行健康信息读取:
sudo smartctl -a /dev/nvme0n1
4、在输出结果中定位关键字段:
Percentage Used: 42%(表示当前寿命已消耗 42%,剩余约 58%)
Data Units Written: 12754692 [6.53 TB](累计写入量,可用于长期趋势比对)
二、在宝塔面板中配置自定义监控脚本并可视化展示
该方法将 smartctl 采集结果转化为结构化数据,并通过宝塔“计划任务”定时执行、写入日志文件,再借助“监控”模块的自定义图表或第三方插件(如 Grafana 集成)实现可视化追踪,适合需长期观测写入衰减趋势的生产环境。
1、创建寿命采集脚本:
sudo nano /www/server/panel/script/ssd_life.sh
2、在脚本中写入以下内容(以 nvme0n1 为例):
#!/bin/bash
DATE=$(date "+%Y-%m-%d %H:%M:%S")
LIFE=$(sudo smartctl -a /dev/nvme0n1 2>/dev/null | grep "Percentage Used" | awk '{print $4}' | tr -d '%')
WRITTEN=$(sudo smartctl -a /dev/nvme0n1 2>/dev/null | grep "Data Units Written" | awk '{print $4 " " $5}')
echo "$DATE | Life: ${LIFE}% | Written: ${WRITTEN}" >> /www/wwwlogs/ssd_life.log
3、赋予执行权限:
sudo chmod +x /www/server/panel/script/ssd_life.sh
4、在宝塔面板「计划任务」中添加:任务类型选“Shell 脚本”,周期设为“每30分钟”,脚本内容填入:
/www/server/panel/script/ssd_life.sh
5、检查日志生成是否正常:
tail -n 5 /www/wwwlogs/ssd_life.log
应可见类似格式输出:
2026-03-15 22:30:00 | Life: 42% | Written: 6.53 TB
三、结合宝塔监控模块查看磁盘 I/O 持续写入行为
虽然宝塔不显示 SSD 寿命数值,但其内置的实时 I/O 监控可暴露异常写入模式——高频小文件写入、持续高 %util 或 await 值,是加速寿命损耗的典型表现,属于间接但强关联的寿命风险预警信号。
1、登录宝塔面板,在左侧菜单点击「监控」→「开启监控」(若尚未启用)
2、在监控首页或「磁盘IO」子页中,观察以下指标:
await 值持续高于 20ms(NVMe)或 50ms(SATA)
%util 长期维持在 95% 以上且无业务峰值对应
3、若发现上述现象,立即配合 iotop 定位写入进程:
sudo iotop -o -b -n 1 | head -20
4、重点关注 WRITE 列数值高的进程名(如 python3、nginx、mysqld、dockerd),确认其是否执行 checkpoint 保存、日志轮转或临时缓存等高写入操作
四、部署 DiskInfo 类轻量级寿命监控服务
该方法引入专为 AI/GPU 服务器设计的 DiskInfo 工具链,它可自动解析 NVMe Log Page 0x02 中的 Data Units Written 字段,并按厂商规范换算为 TBW 与剩余寿命百分比,支持 HTTP 接口与 Prometheus 指标导出,与宝塔共存无冲突。
1、下载并解压 DiskInfo 工具(以 Linux x86_64 为例):
wget https://github.com/diskinfo-team/diskinfo/releases/download/v1.2.0/diskinfo-linux-amd64.tar.gz
tar -xzf diskinfo-linux-amd64.tar.gz
2、赋予执行权限并测试运行:
chmod +x diskinfo
sudo ./diskinfo -d /dev/nvme0n1
3、输出中将明确显示:
Lifetime Remaining: 58%
Total Bytes Written: 6.53 TB
Estimated Endurance: 287 days remaining (at current rate)
4、设置为系统服务并开机自启(可选),确保持续采集:
sudo cp diskinfo /usr/local/bin/
sudo systemctl enable --now diskinfo-monitor@nvme0n1.service










