GPU Hot – 100+服务器GPU可视化管理工具|利用率、温度、内存

当需要管理多台 GPU 服务器,通过 SSH 连接到每台机器上查看显卡运行状态,来回切换确实挺麻烦。GPU Hot 这个开源工具正好解决这个痛点,让我们能在浏览器中可视化统一管理所有 GPU 资源。不仅能实时监控单台机器的所有 GPU,还支持集群模式统一管理多台服务器,所有数据都以图表形式直观展示。

只需一条 Docker 命令即可部署,并且支持单机和集群两种模式,有需要的同学可以看一下。

J.Cling 推荐拓展:

主要功能特点

  • 实时监控 GPU 利用率、温度、内存和功耗等关键指标;
  • 自动检测多个 GPU 并显示详细的进程信息;
  • 支持集群模式,可在一个界面管理 100+ 台 GPU 服务器;
  • 提供历史图表,追踪 GPU 性能变化趋势;
  • 包含系统监控,同时显示 CPU 和内存使用情况;
  • WebSocket 实时更新,响应速度低于 1 秒。

官方使用说明

见网盘

更新日志

v1.5.3

  • 通过 @0 修复进程名称

获取方式

官方网站

https://github.com/psalias2006/gpu-hot

网盘下载

https://pan.quark.cn/s/3f57a6fa3460

更多趣软酷站请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/internet-resources

© 版权声明

相关文章