Störung eines Storage-Servers (FS1006)
Incident Report for rackSPEED GmbH
Resolved
Das Storage-System konnte ohne weitere Zwischenfälle oder Datenverlust evakuiert werden. Alle betroffenen Server liegen nun auf neuen Geräten und arbeiten ohne Auffälligkeiten. - Wir beenden unseren Einsatz an dieser Stelle und wünsche einen schönen Abend.
Posted Nov 24, 2022 - 17:26 CET
Update
Die Evakuierung des Storage Servers läuft weiterhin nach Plan, 80% der Daten wurden bereits verschoben. Wir sind guter Dinge den Vorgang am späten Vormittag komplett abschließen zu können. - Update folgt...
Posted Nov 24, 2022 - 06:31 CET
Monitoring
Die Evakuierung des Storage Servers läuft nach Plan und schreitet schnell voran. - Update folgt...
Posted Nov 23, 2022 - 21:05 CET
Identified
Soeben ist zusätzlich ein Compute-Node ausgefallen, hierbei kam es bei einer Hand voll VMs einer Unterbrechung der Services. Alle VMs wurden auf andere Compute-Nodes migriert und laufen bereits wieder. Die Migration des Storage-Servers läuft nach wie vor. - Update folgt...
Posted Nov 23, 2022 - 18:04 CET
Monitoring
Die Migration der betroffenen Kundendaten läuft nun mit maximaler Geschwindigkeit, dies führt vereinzelt zu einer schlechteren Antwortzeit der Dienste und kurzen Störungen in der Erreichbarkeit. Dieser Zustand wird sich mit jeder geretteten VM im Laufe des Abends nach und nach verbessern.

Bisher gab es keine weiteren Besonderen Vorkommnisse, wenn dies so bleibt können wir die Arbeiten in der Nacht abschließen. - Update folgt...
Posted Nov 23, 2022 - 16:37 CET
Identified
Das Problem konzentriert sich auf einen Storage-Server welcher droht in Kürze auszufallen. Wir bereiten nun die Evakuierung der betroffenen VMs vor und starten kurzfristig mit den notwendigen Arbeiten. - Update folgt...
Posted Nov 23, 2022 - 15:06 CET
Investigating
Unser Monitoring meldet vereinzelt Probleme bei der Performance von ca. 80 VMs. Wir untersuchen den Fall bereits und werden kurzfristig weitere Infos veröffentlichen. - Update folgt...
Posted Nov 23, 2022 - 14:52 CET
This incident affected: SSD Hosting Server, SSD CloudServer, and Elasticsearch.