\\\\ ٩( 'ω' )و ////
id:ayatk
Prometheusとdcgm-exporterを使ってGPUの監視をする
Prometheus を使うとなったとき、 node-exporter を使ってマシンの CPU 使用率やメモリの使用量を監視すると思います。 しかし、GPU の監視をしようとしたとき、node-exporter だけでは GPU のメトリクスを取ることができません。 そこで NVIDIA/gpu-monitoring-tools にある dcgm-exporter という exporter を使うことで …