第230828期 - 一款酷炫的终端监控GPU工具
2.5k star,介绍一款交互式GPG监控方案1 nvitop简介
交互式 NVIDIA-GPU 进程查看器及其他,GPU 进程管理的一站式解决方案。
nvitop 是一个交互式 NVIDIA 设备和过程监控工具。它具有丰富多彩且信息丰富的界面,可不断更新设备和进程的状态。
除此之外,该软件包还为深度学习研究人员提供了 CUDA 设备选择工具 nvisel 。它还提供了方便的API,允许开发人员编写自己的监视工具。
2 安装
pip3 install --upgrade nvitop
3 用法
- 查看设备和进程状态,类似于nvidia-smi
# Query the status of all devices
$ nvitop -1 # or use `python3 -m nvitop -1`
# Specify query devices (by integer indices)
$ nvitop -1 -o 0 1 # only show <GPU 0> and <GPU 1>
# Only show devices in `CUDA_VISIBLE_DEVICES` (by integer indices or UUID strings)
$ nvitop -1 -ov
# Only show GPU processes with the compute context (type: 'C' or 'C+G')
$ nvitop -1 -c
当 -1 开关打开时,结果将仅显示一次(与 的默认 nvidia-smi 行为相同)。这要快得多,并且资源使用率更低。有关更多命令选项,请参阅命令行选项。
- 资源监控
# Monitor mode (when the display mode is omitted, `NVITOP_MONITOR_MODE` will be used)
$ nvitop # or use `python3 -m nvitop`
# Automatically configure the display mode according to the terminal size
$ nvitop -m auto # shortcut: `a` key
# Arbitrarily display as `full` mode
$ nvitop -m full # shortcut: `f` key
# Arbitrarily display as `compact` mode
$ nvitop -m compact # shortcut: `c` key
# Specify query devices (by integer indices)
$ nvitop -o 0 1 # only show <GPU 0> and <GPU 1>
# Only show devices in `CUDA_VISIBLE_DEVICES` (by integer indices or UUID strings)
$ nvitop -ov
# Only show GPU processes with the compute context (type: 'C' or 'C+G')
$ nvitop -c
# Use ASCII characters only
$ nvitop -U # useful for terminals without Unicode support
# For light terminals
$ nvitop --light
# For spectrum-like bar charts (requires the terminal supports 256-color)
$ nvitop --colorful
在监视模式下,您可以使用 / / 键中断/终止 Ctrl-c / T K 终止进程。建议在树视图屏幕中终止或终止进程(快捷方式: t )。对于普通用户, nvitop 会浅化其他用户的进程(在低强度的颜色中)。对于系统管理员,您可以使用 终止 sudo nvitop 其他用户的进程。
4 软件特性或亮点
- 信息丰富且花哨的输出:显示比彩色花哨框图更多的 nvidia-smi 信息。
- 监控模式:可以作为资源监视器运行,而不是只打印一次结果。
- 条形图和历史图表
- 进程分类
- 进程过滤
- 通过键盘可以发送信号给进程
- GPU进程及其父进程的树状显示
- 帮助显示
- 支持鼠标操作
- 支持交互式操作
- 有效
- 可移植,适用于windwos或者linux环境
- 使用跨平台库 PSout 获取主机进程信息,而不是在子进程中调用 ps -p
- 纯Python编写,易于安装 pip
- 可集成,易于集成到其他应用中,而不仅仅是监控。
5 总结