1、首先在ubuntu系统中按Ctrl+Alt+T快捷键打开命令输入框,输入“gnome-terminal”命令,然后按回车键即可打开终端:
2、然后在终端中输入命令“lspci | grep -i nvidia”即可得到NVIDIA显卡的信息:
3、最后可以用Linux查看Nvidia显卡信息及使用情况,Nvidia自带一个命令行工具可以查看显存的使用情况,终端输入“nvidia-smi”
B. 查看linux电脑gpu的参数
1、Linux查看显卡信息:
lspci | grep -i vga
2、使用nvidia GPU可以:
lspci | grep -i nvidia
表头释义:
Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A;
Temp:显卡内部的温度,单位是摄氏度;
Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
Pwr:能耗表示;
Bus-Id:涉及GPU总线的相关信息;
Disp.A:是Display Active的意思,表示GPU的显示是否初始化;
Memory Usage:显存的使用率;
Volatile GPU-Util:浮动的GPU利用率;
Compute M:计算模式;
下边的Processes显示每块GPU上每个进程所使用的显存情况。
如果要周期性的输出显卡的使用情况,可以用watch指令实现:
watch -n 10 nvidia-smi
命令行参数-n后边跟的是执行命令的周期,以s为单位。
C. Linux下使用Unigine-heaven测试显示卡
软件官网:benchmark.unigine.com/h...
Linux版本的下载链接为:assets.unigine.com/d/Un...
下载的安装文件名为Unigine_Heaven-4.0.run。
将安装文件复制到Linux系统桌面或任意目录,并在终端中执行:sudo ./Unigine_Heaven-4.0.run进行安装。
安装完成后,会在保存安装文件的目录下生成一个Unigine_Heaven-4.0的目录。进入该目录,使用终端执行:sudo ./heaven启动程序。
软件主界面提供了语言、画面质量等设置选项,点击“Run”开始运行测试。
测试画面与3DMARK相似,屏幕右上角显示具体信息,包括实时帧率、显卡型号、核心频率、显存频率和GPU运行温度。
以华硕GTX1050ti为例,在Ubuntu 18.04.4系统下,默认的Nouveau开源显示卡驱动导致Unigine Heaven测试的平均帧率仅为1帧,无法正常运行。安装从NVIDIA官网下载的显示卡驱动后,帧率提升至69,画面流畅。
安装独显驱动后,在终端输入:sudo nvidia-settings打开显示卡面板。
在PowerMizer栏目下,将右侧最下面的Prefered Mode设置为“Prefer Maximum performance”,这样GPU频率和显存频率将始终保持最高频率运行。
D. 命令查看Linux服务器内存、CPU、显卡、硬盘使用情况
大致结果类似下图:
Mem行(单位均为M):
(-/+ buffers/cache)行:
Swap行指交换分区。
实际上不要看free少就觉得内存不足了,buffers和cached都是可以在使用内存时拿来用的,应该以(-/+ buffers/cache)行的free和used来看。只要没发现swap的使用,就不用太担心,如果swap用了很多,那就要考虑增加物理内存了。
大致结果类似下图:
上方文字部分的红框为总的CPU占用百分率,下方的表格是每个进程的CPU占用率,在表格第一行可以看到红框中占用率超过了150%,这是因为服务器是多核CPU,而该进程使用了多核。
大致结果类似下图:
表格中会显示显卡的一些信息,第一行是版本信息,第二行是标题栏,第三行就是具体的显卡信息了,如果有多个显卡,会有多行,每一行的信息值对应标题栏对应位置的信息。
需要注意的一点是显存占用率和GPU占用率是两个不一样的东西,类似于内存和CPU,两个指标的占用率不一定是互相对应的。
在下面就是每个进程使用的GPU情况了。
大致结果如下图:
表格中每一行代表一个文件系统,各列意义如下:
要查看具体某个文件或者文件夹的大小的话,可以使用下面的命令:
命令可以查看文件或文件夹的磁盘使用空间,而-h参数的意思是使用GB、MB等易读的格式。如果不带--max-depth参数,那么将循环列出文件夹下所有文件和文件夹占用的空间,带此参数,则是指定深入目录的层数。
如果要看文件夹下所有文件的大小,可以使用*:
查看作者首页
E. Linux中如何管理Nvidia GPU卡
1.查看显卡信息
由于测试环境使用的是NVIDIA的显卡,这里直接通过lspci命令即可查询具体显卡信息
“00:06.0”,这一个参数是总线编号,第二个是插槽编号,第三个是功能编号,它们都是十六进制的数字。
2.查看显存以及GPU的使用情况
Nvidia自带一个命令行工具可以查看显存的使用情况: nvidia-smi
参数解释:
Fan: 显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A;
Temp: 显卡内部的温度,单位是摄氏度;
Perf: 表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
Pwr: 能耗表示;
Bus-Id: 涉及GPU总线的相关信息;
Disp.A: 是Display Active的意思,表示GPU的显示是否初始化;
Memory Usage: 显存的使用率;
Volatile GPU-Util: 浮动的GPU利用率;
Compute M: 计算模式;
下边的Processes显示每块GPU上每个进程所使用的显存情况,上述测试环境没有,可参考它图如下:
3.周期性的输出显卡的使用情况
可以参考如下命令:
命令行参数-n后边跟的是执行命令的周期,以s为单位。
1.列出所有可用的Nvidia设备
2.列出每个GPU卡的详细信息
3.查询某个GPU卡的详细信息 (指定GPU卡的id,只截图一部分)
4.要以1秒的更新间隔监控GPU的总体使用情况
5.要以1秒的更新间隔监视每个进程的GPU使用情况
6.加上-pm参数可设置持久模式:0/禁用,1/启用
7.加上-e参数可以切换ECC支持:0/禁用,1/启用
8. 加上-r参数可以重启某个GPU卡(0是GPU卡的序号)