Ausfall eines Storage-Servers (FS1001)
Incident Report for rackSPEED GmbH
Resolved
Abschließend wurden alle betroffenen Server und Dienste überprüft um versteckte Fehler ausschließen zu können. Wir beenden unseren Einsatz an dieser Stelle und wünschen Ihnen einen schönen Tag.
Posted Sep 12, 2022 - 12:34 CEST
Monitoring
Auf einigen Compute-Nodes wurde der ausgefallene Storage-Server nicht korrekt erkannt. Dies führte dazu das einige Verbindungen offen geblieben sind wodurch ein erneuter Verbindungsaufbau verhindert wurde. Nachdem die Verbindungen manuell beendet wurden stellten die Server automatisch alle fehlenden Verbindungen wieder her.
Posted Sep 12, 2022 - 11:56 CEST
Identified
Das Problem konzentriert sich auf einen Storage-Server welcher soeben ohne Vorwarnung ausgefallen ist. Nach einem Reboot scheint das System nicht ganz rund zu laufen, die meisten VMs sind allerdings bereits wieder online. - Update folgt...
Posted Sep 12, 2022 - 11:06 CEST
Investigating
Derzeit verzeichnen wir vereinzelt Probleme bei der Erreichbarkeit einiger VMs. - Update folgt...
Posted Sep 12, 2022 - 10:50 CEST
This incident affected: SSD Hosting Server and SSD CloudServer.