根本原因是脚本未捕获异常、存在交互式输入、标准流异常或未适配守护环境,需配合&后台运行,并修改脚本以处理信号、禁用input、规范日志、显式导出环境变量。

nohup 运行 Python 脚本后为什么还是退出了
根本原因通常是脚本本身抛出未捕获异常、依赖的 stdin/stdout/stderr 被意外关闭,或 nohup 没真正脱离终端控制。不是 nohup 失效,而是没配对使用。
- 必须加
&放到后台,否则仍会阻塞当前 shell:nohup python script.py & - 默认输出重定向到
nohup.out,但若脚本里显式调用了sys.stdout.flush()或写入了非缓冲流,可能因文件权限/磁盘满导致崩溃 - Python 的
input()会直接报EOFError—— 后台进程没有 stdin,这类交互式代码必须删掉或改用配置文件 - 某些服务器(如 systemd 管理的)会 kill 掉无父进程的孤儿进程,
nohup不解决这个问题,得配合setsid或改用systemd服务
Python 脚本要怎么改才能稳住不挂
不能只靠 shell 命令兜底,脚本自身得适应守护环境。重点是处理信号、关闭交互、接管日志。
- 捕获
SIGTERM和SIGHUP:用signal.signal(signal.SIGTERM, handler)做优雅退出,避免强制 kill 导致数据丢失 - 禁用
input()、raw_input()、getpass.getpass()—— 后台无终端输入源,一调就崩 - 日志别只打
print():用logging.basicConfig(filename='app.log', level=logging.INFO),否则输出全堆在nohup.out里难排查 - 如果脚本依赖环境变量(比如
DJANGO_SETTINGS_MODULE),启动前必须显式导出:nohup env PYTHONPATH=/path/to/project DJANGO_SETTINGS_MODULE=conf.settings python manage.py runserver &
nohup + Python 的常见错误现象和对应解法
看到这些表现,基本能定位到具体环节:
-
nohup: ignoring input and appending output to 'nohup.out'是正常提示,不是错误;但如果后续nohup.out为空或只有几行,说明脚本秒退了 —— 检查是否 import 失败或顶层异常 - 脚本运行一会儿就消失,
ps aux | grep python找不到:大概率是未捕获的Exception或SystemExit,加try...except Exception as e: logging.exception(e)包住主逻辑 -
ImportError: No module named xxx:nohup启动时用的是系统默认 Python 环境,不是你 virtualenv 里的 —— 必须用绝对路径调用解释器,比如/home/user/venv/bin/python script.py - 日志写一半卡住:Python 默认行缓冲,后台下 stdout 变成全缓冲,
print("log")不会立刻落盘 —— 加-u参数强制无缓冲:nohup python -u script.py &
比 nohup 更靠谱的替代方案有哪些
nohup 是 quick fix,不是生产级方案。真要长期跑,优先考虑这些:
立即学习“Python免费学习笔记(深入)”;
- 用
systemd写 service 文件:支持自动重启、资源限制、日志轮转,Restart=always能扛住崩溃,比手动 nohup 稳得多 - 用
supervisord:适合多进程管理,配置简单,autostart=true和autorestart=true开箱即用 - 用
tmux或screen:适合调试阶段,能随时 attach 查看实时输出,但不适合无人值守场景 - 云环境直接上
docker run -d --restart=unless-stopped:镜像打包好依赖,隔离性更强,日志统一走 stdout
nohup 最容易被忽略的一点:它不管理子进程。如果你的 Python 脚本 fork 了子进程(比如用 subprocess.Popen 启了另一个 Python),那些子进程默认仍挂在当前 session 下,父进程一挂,它们很可能被 SIGKILL。真要用,得在子进程里加 preexec_fn=os.setsid 或用 start_new_session=True。










