本文结合平台用户的使用场景,整理出了使用服务器时遇到的常见代码问题。本文持续更新中,若您有任何建议,欢迎向极链云助手提出。
#没有运行实例,但显存一直占满怎么办?
出现这种情况一般是因为之前运行的程序没有被释放。
# 查看正在进行的进程ps -ef# 释放被占用的kill PID列显示为-9的进程。
#如何将训练挂到后台运行?
# 该命令是把输出结果重定向到 /tmp/log文件nohup python test.py > /tmp/log 2>&1 查看您的训练任务打出来的logtail -f /tmp/log
您在python 中 print 之后需要调用 sys.stdout.flush 才能让log实时的重定向到文件中。或者在python3 中您也可以 print 这样的方式让log实时的重定向到文件中。
#怎么解压压缩包?
#检查已安装的软件包是否有可用的更新,给出汇总报告apt update# 安装zip命令apt install zip#解压文件unzip name.zip
#如何查看实例是否在运行?
您可以通过查看GPU的使用率,根据Memory-Usage和Volatile GPU-Util两个关键指标来判断实例是否在运行。代码如下:
nvidia-smi