Das dynamische Auslesen von zu überwachenden HOSTS und damit das automatische Erstellen von Checks ist eine der starken Seiten von CheckMK.
Dieses Tool kann autark installiert werden oder im Rahmen von Installtionen wie OMD oder Openitcockpit, welches CheckMK dann als Erweiterung unter der Haube mitnutzen.
Im folgenden verwende ich Openitcockpit mit installiertem CheckMK Modul um das Grundvorgehen zu zeigen.
Voraussetzung: Im Nutanix Prism Central ist SNMP eingerichtet auf
a) Port 161/UDP
b) Ein Username und Kennwörter fuer SHA und AES
Sind diese Voraussetzung gegeben legen wir nun in Openitcockpit einen neuen Host an welcher via Default erstmal nur angepingt würde:
Anschliessend wählen wir für diesen neu anzulegenden Host das CheckMK Discovery aus:
Als Methode zum Disovery kommt nun SNMP zum Einsatz inklusive der Version SNMP V3 mit den im Nutanix Cluster hinterlegten Credentials!
Nach dem Start des Discory dauert es einige Zeit bis alle lesbaren Werte ermittelt sind. Kommt hier kein Ergebnis sind meist die Kennwörter falsch eingetragen oder MD5 anstatt SHA in der Authentifizierung ausgewählt worden!
Bei Erfolg sollten wir nun diverseste Services auswählen können:
Wir sehen diverse Parameter die aufgelistet werden. Der Memory-Check unten ist noch unbekannt. Grund: Es gibt dafür noch kein ServiceTemplate im Nagios was wir dem CheckMK Module mitteilen müssen. Je nach Nutzung von CheckMK unter Nagios wird diese Liste immer länger und muss einmalig für discoverte Checks angepasst werden. Daher brechen wir im o.g. Wizard das Discovery ab und legen für Memory auch kurz einen Check an. Dazu kopieren wir den Namen des Checks welcher noch unbekannt ist und legen ein sog. “Service Template” an welches via “check_mk_active” in Nagios genutzt wird.
Abschliessend verbinden wir dieses “Service Template” nun mit dem CheckMK Module um es genau hier nutzbar beim Discovery zu machen.
Jetzt führen wir das Discovery erneut aus:
Bingo. Soweit alles erkannt. Ich lasse mal beispielhaft ALLE Checks anlegen was im späteren Betrieb genau abgewogen werden sollte. Nicht alles was man Monitoren kann, macht Sinn immer zu monitoren.
Wir lassen nun die Checks anlegen und refreshen die Config vom Nagios basierten System. Anschliessend sollte das Ergebnis ungefähr so aussehen:
ACHTUNG: NICHT alle Resulte werden vom Discovery sauber ausgewertet und werfen noch Fehler. Da ist dann noch Handarbeit angezeigt. Dieses Troubleshooting würde hier aber den Rahmen sprengen.