• Liebe User, bitte beachtet folgendes Thema: Was im Forum passiert, bleibt im Forum! Danke!
  • Hallo Gemeinde! Das Problem leidet zurzeit unter technischen Problemen. Wir sind da dran, aber das Zeitkontingent ist begrenzt. In der Zwischenzeit dürfte den meisten aufgefallen sein, dass das Erstellen von Posts funktioniert, auch wenn das Forum erstmal eine Fehlermeldung wirft. Um unseren Löschaufwand zu minimieren, bitten wir euch darum, nicht mehrmals auf 'Post Reply' zu klicken, da das zur Mehrfachposts führt. Grußworte.

server überwachung / heart beat

deleted_24196

Community-Forum
Mitglied seit
06.07.2001
Beiträge
19.787
Reaktionen
1
hi,

frage an die admins hier: wie überwacht ihr eure server? erst einmal ganz rudimentär; also wirklich nur, ob der server da ist und angesprochen werden kann...

macht ihr das über ne weboberfläche wo im hintergrund zB nen php-script die server anpingt und das ganze dann grafisch (grünes symbol = server da und antwortet; rotes symbol = server antwortet nicht) darstellt oder auf andere art und weise?
 
Zuletzt bearbeitet:

Shihatsu

Administrator
Mitglied seit
26.09.2001
Beiträge
49.642
Reaktionen
10.259
3 stufig:
fürs monitoring nen testclient, der alle 60 sekunden nen getfile macht, startzeitpunkt, anfang respone und ende response werden gemessen und haben paramater, die aussagen was rot, was gelb und was grün ist - das ganze dann schön auffe weboberfläche.
fürs sla geschisse das ganze nochmal in textform, doppelt gespeichert für redundanz und so, nech was?
für eskalation läuft über das monitoring, welches geclustert ist, nochmal nen "monitoring" - bei 3al rot hintereinander gibts eskalationsmails inkl sms. nervt am anfang leicht wenn das system unter last noch ent ganz rund läuft :ugly:
 
Mitglied seit
21.01.2001
Beiträge
3.078
Reaktionen
0
Nagios.

Konfiguration ist ein bissl ein Gepfriemel, aber es gibt massig plugins dafuer um so ziemlich alles zu ueberwachen, und man kann es auch relativ einfach dazu kriegen, schoene Graphen zu malen.
 

parats'

Tippspielmeister 2012, Tippspielmeister 2019
Mitglied seit
21.05.2003
Beiträge
20.337
Reaktionen
1.792
Ort
St. Gallen
GFI Network Server Monitor. Bei Fehlschlag geht ne Mail an uns raus. Test ca. alle 60 Sekunden.
Geht über die grundlegenden Sachen wie Ping noch weiter hinaus.
 

deleted_24196

Community-Forum
Mitglied seit
06.07.2001
Beiträge
19.787
Reaktionen
1
@shi
hört sich vernünftig an, danke :)

@yussuf
nagios sieht ja schon ziemlich geil aus, aber wie werden die daten der server abgegriffen? wird da überall ein plugin installiert?

@parats
kostet leider geld und ist deswegen nichts für mich :(
 
Mitglied seit
21.01.2001
Beiträge
3.078
Reaktionen
0
jo, auf allen zu ueberwachenden Servern wird (im Normalfall, man kann auch irgendwas mit SSH Verbindungen machen) das NRPE Plugin installiert.

Bei Gentoo ist das im emerge drin, dh. man macht als root nur ein emerge nagios-nrpe, dann packt man noch den nrpe service mit port 5667 in die services, setzt nrpe ins default runlevel mit rein und definiert dann fix die genauen checks, die man an dem Host ausfuehren moechte, dazu muss man noch den ueberwachenden Server in der config zu den 'allowed hosts' packen.

Die Firma von meinem Schwager ueberwacht mit einem Nagios Server 1k Server und 6k Services.
 
Mitglied seit
21.01.2001
Beiträge
3.078
Reaktionen
0
man kann damit Windows PCs ueberwachen, der Nagios Server laeuft aber nur unter Linux/Unix.
 

deleted_24196

Community-Forum
Mitglied seit
06.07.2001
Beiträge
19.787
Reaktionen
1
einen linuxserver krieg ich wohl noch aufgestellt ;)

werd mir nagios dann mal bei zeiten angucken... danke :)
 
Mitglied seit
20.04.2005
Beiträge
2.888
Reaktionen
0
Ort
Österreich
Wir verwenden Nagios hier. Ist recht gut, und kann man mit drölf plugins und gui's erweitern.

empfehlen kann ich das mod icinga, ist eine 3rd party weiterentwicklung von nagios mit noch besseren einstellungsmöglichkeien.

wir überwachen z.b. damit nicht nur unsere server (ping, sitecheck, ram, cpu, hdd usw) sondern auch dienste wie USV, klimaanlage, rauchmelder, serverraum-temperatur usw.

benachrichtigung ist via anruf, sms, mail, icq usw möglich. es gibt teilweise auch möglichkeiten dann z.b. via sms zu reagieren (z.b. rebooten, bestimmten prozess neu starten usw).

auswertungen sind natürlich 1a.
 
Mitglied seit
21.09.2001
Beiträge
3.435
Reaktionen
2.007
nagios, hardcore inner konfiguration aber nicht zu überbieten.
 
Mitglied seit
21.01.2001
Beiträge
3.078
Reaktionen
0
kann mir einer der Leute, die sich damit auskennen, erklaeren warum

#!/bin/bash
VAR=`ruby /home/armin/code/cc/keys.rb $1 $2`

if [ $? -gt -1 ]; then
echo "OK - $VAR entries $2"
exit 0

mir bei manuellem testen richtig schoene Ausgaben gibt ala 'OK - 34093 entries to crawl'

aber Nagios sagt

o_crawl_queue

UNKNOWN 04-08-2010 06:08:44 0d 13h 28m 33s 3/3 NRPE: Unable to read output

edit: Fehler gefunden. Ich wars gewohnt, die plugins nur beim Namen aufzurufen in der nrpe.cfg, aber mein eigenes Plugin hatte ja ne .sh Endung. Die noch hingemacht, jetzt gehts.
 
Zuletzt bearbeitet:
Oben