Downtime

Kurze Downtime

Zwischen 9:13 und 9:17 Uhr kam es heute leider zu einer kleinen Downtime. Die genaue Ursache muss noch geklärt werden, aber der Server hat ziemlich viel Arbeitsspeicher benötigt. Ich vermute, dass es etwas mit PubSub zu tun hat. Ich werde das mal genauer im Auge behalten und demnächst eine Lösung dafür umsetzen.

Arbeitsspeicher Erweiterung

Morgen früh zwischen 5:30 und 7 Uhr wird nun der Arbeitsspeicher des Server um 4 GB erweitert, um das Problem mit den Ausfällen zu lösen. In diesem Zeitraum wird kurzzeitig der Server nicht erreichbar sein, aber dies sollte nicht allzu lange dauern.

Update: Leider wurde beim Hinzufügen von zusätzlichen RAM ein defekter Riegel verbaut. Hierdurch konnte der Server erstmal nicht gestartet werden und der Support im Rechenzentrum hat leider etwas auf sich warten lassen. Dadurch kam es auf etwa eine Downtime von knapp 3,5 Stunden. Der Server sollte aber nun nach der Erweiterung für die nächste Zeit stabil laufen.

Ausfälle in den letzten 24 Stunden

In den letzten 24 Stunden gab es leider 3 Ausfälle. Die Ausfälle wurden dadurch verursacht, dass der Jabber Server auf einmal deutlich mehr Arbeitsspeicher als normal reservieren wollte.

An dem Problem wird gearbeitet. Bisherige Maßnahme, um etwas an diesem Problem zu lösen, war erstmal alte Konten, die seit 2 Jahren nicht oder noch nie benutzt wurden, zu löschen. Dies hat bisher den Arbeitsspeicherverbrauch des Jabber Servers wieder normalisiert. Falls das Problem wieder auftritt, werde ich noch ein paar andere Maßnahmen ausprobieren. Eventuell wird einfach bald mehr Arbeitsspeicher im Server verbaut.

Bitte entschuldigt die Unannehmlichkeiten.

Ausfall

Heute gab es leider einen Ausfall des Jabber Servers zwischen 20:25 und 21:35 Uhr. Der Ausfall wurde wahrscheinlich durch ein Problem mit der erlang VM, auf die der Jabber Server aufsetzt, verursacht. Ich muss heute Nacht gegen 3 Uhr nochmal kurz den Server neustarten, damit ich das Problem endgültig beheben kann, weswegen der Jabber Server nochmal für voraussichtlich 5 Minuten nicht erreichbar sein wird.
Ein weiteres Problem war leider noch, dass gerade das Monitoring für den Jabber Server umkonfiguriert wurde, weswegen der Ausfall leider nicht sofort bemerkt wurde.

Bitte entschuldigt die Unannehmlichkeiten.

Schluckauf im Rechenzentrum

Jetzt gerade (ab 23:30 Uhr) ist der Server leider nur sporadisch erreichbar. Ursache sind Probleme beim Betreiber des Rechenzentrums. An dem Problem wird schon gearbeitet und es sollte bald wieder alles richtig funktionieren.

Kurzer Ausfall

Heute zwischen 16:20 und 16:30 Uhr kam es leider zu einem Ausfall des Jabber Servers. Ausgelöst wurde der Ausfall durch die Jabber Server Software, die von einem Augenblick auf den nächsten den kompletten Arbeitsspeicher des Servers reservieren wollte. Es sollte nun aber wieder alles funktionieren.

Kurzer Neustart

Am 11. Oktober wird der Server einmal kurz um 5:45 Uhr morgens neu gestartet. Zweck dieses Neustarts ist die erneute Einrichtung von IPv6, die leider seit dem Umzug nicht mehr funktioniert. Gleichzeitig werde ich noch die Transport Software auf dem Server auf die aktuelle Version aktualisieren, die hauptsächlich ein paar kleinere Fehler behebt.

Der Server wird voraussichtlich nach 10 Minuten wieder verfügbar sein.

Update: Der Neustart verlief ohne weitere Probleme.

Verlagerung des Server Standortes

Am 4. Oktober wird dieser Server zwischen 22:30 Uhr und 7:30 Uhr in ein neues Rechenzentrum in Falkenstein verlagert. Der Betreiber des Rechenzentrums, in dem dieser Server hier steht, hat ein neues Rechenzentrum gebaut und wird den Großteil der im alten Rechenzentrum befindlichen Server dorthin verlagern. In dieser Zeit wird der Server leider nicht verfügbar sein, aber es kann auch gut sein, dass der Server schon ein paar Stunden früher wieder erreichbar sein wird, falls die Verlagerung ohne Probleme durchgeführt werden kann.

Weiterer Festplattenausfall

Die im letzten Monat ausgetauschte Festplatte ist heute leider ausgefallen weswegen es zwischen 7 und 9:30 Uhr zu einem Ausfall kam. Voraussichtlich wird die Festplatte morgen gegen 6:30 Uhr ausgetauscht werden, wodurch es nochmal zu einem kurzen Ausfall kommen wird.

Update: Die Festplatte wurde erfolgreich ausgetauscht.

Festplattenausfall

Eine der beiden Festplatten hat sich vorhin leider auf dem Server verabschiedet und das hatte zur Folge, dass kurz vor 6 Uhr bis gegen 9:30 Uhr der Server nicht erreichbar war. Die Festplatte wird am Montag gegen 6:30 Uhr ausgetauscht werden, wodurch der Server noch einmal kurz unerreichbar sein wird.

Update: Die Festplatte wurde ausgetauscht.

Inhalt abgleichen (C01 _th3me_)