服务器卡机之后强制重启出现的问题。
原因及拟解决方法:
原因: 可能为NVIDIA显卡问题。
拟解决方法:
mount -o rw,remount /
to mount the drive in Read-Write mode.sudo apt-get purge nvidia-*
to purge the NVIDIA driver.apt-get purge xserver-xorg
)reboot
重启一下试试。/etc/default/grub
as root, edit the GRUB_CMDLINE_LINUX_DEFAULT line to include it. For example, if you have “splash” listed there already, you’d change it to this Code: 禁用nouveau驱动GRUB_CMDLINE_LINUX_DEFAULT="splash nouveau.modeset=0"
reboot
重启,然鹅并没有什么用,仿佛啥也没干过。sudo apt-get install nvidia-367
原因:gdm3的问题。
拟解决方法:
进入tty模式,并执行sudo apt-get install slim
出现蓝色选择框选择slim。
reboot
重启.
重启错误改变为 /dev/sda1 ** :clean, **/*** files,***/*** blocks
使用以下命令:
reboot
重启后显示:The System is running in low-graphics mode
参考:https://zhuanlan.zhihu.com/p/36087073
这类报警提示绝大部分是跟显卡驱动更新导致的系统不兼容有关,因此主要针对你所使用的显卡驱动进行检测:(本GPU服务器所用Nvidia Titan显卡)
① 检测是否是nvidia显卡驱动问题:
进入root用户,输入
root@amax:~# nvidia-smi
sudo apt purge nvidia-*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt install nvidia-381
(这一步我不知道是不是安装这个版本就用了下面一条命令替换)sudo ubuntu-drivers autoinstall
再次nvidia-smi
返回:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
则说明是显卡驱动更新导致系统不兼容的问题。
若结果输出如下结果,则表明显卡驱动正常:
±----------------------------------------------------------------------------+
| NVIDIA-SMI 384.98 Driver Version: 384.98 |
|-------------------------------±---------------------±---------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|=++==============|
| 0 TITAN Xp Off | 00000000:02:00.0 Off | N/A |
| 23% 33C P0 61W / 250W | 0MiB / 12188MiB | 0% Default |
±------------------------------±---------------------±---------------------+
| 1 TITAN Xp Off | 00000000:82:00.0 Off | N/A |
| 23% 24C P0 59W / 250W | 0MiB / 12189MiB | 0% Default |
±------------------------------±---------------------±---------------------+
±----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
±----------------------------------------------------------------------------+
继续往下走 ,使用nvidia-uninstall
发现又是命令不存在……好吧
换一个方法:参考了以下链接,进入修复模式进行操作。
http://archive.3zso.com/archives/ubuntu14.04-running-in-low-graphics.html
重启……得……彻底黑屏了……
sudo mv /var/lib/dpkg/info /var/lib/dpkg/info_old
//现将info文件夹更名sudo mkdir /var/lib/dpkg/info
//再新建一个新的info文件夹sudo apt-get update
,apt-get -f install
//不用解释了吧sudo mv /var/lib/dpkg/info/* /var/lib/dpkg/info_old
//执行完上一步操作后会在新的info文件夹下生成一些文件,现将这些文件全部移到info_old文件夹下sudo rm -rf /var/lib/dpkg/info
//把自己新建的info文件夹删掉sudo mv /var/lib/dpkg/info_old /var/lib/dpkg/info
//把以前的info文件夹重新改回名字参考:http://www.cnblogs.com/jary-wang/archive/2013/05/28/3103829.html
强烈怀疑第一种方法行不通是因为当时没有注意到执行命令的时候出现E: Sub-process /usr/bin/dpkg returned an error code (1),下次可以一试。