rackSPEED GmbH Status - Incident History

DUS3: Wartungsarbeiten Außenanbindung

2024-10-31T01:00:00+01:00

THIS IS A SCHEDULED EVENT Oct 31, 01:00 - 04:00 CET

Oct 18, 15:06 CEST
Scheduled - Im o.g. Zeitraum werden wir die Bandbreiten-Kapazitäten unsere Firewall-Infrastruktur erweitern. Dazu werden die Firewalls an unserem Standort in Düsseldorf ausgetauscht. Da diese Arbeiten weitgehende Änderungen am Routing mit sich bringen, kann es in dem o.g. Zeitfenster zu Unterbrechungen der Internetverbindung kommen. - Wir versuchen diese so kurz wie möglich zu halten.

Einfach betrachtet wird der Internetanschluss des Rechenzentrums mehrfach ein- und ausgeschaltet. Störungen auf den Systemen unserer Kunden sind daher zu 100% ausgeschlossen.

Bitte planen Sie den Vorgang auf Ihrer Seite entsprechend ein. Selbstverständlich steht von unserer Seite ebenfalls ein Techniker in Bereitschaft bereit der den Vorgang begleiten und überwachen wird.

DUS2 + DUS3: Sporadische Probleme bei der Verbindung zu einigen VMs

2024-07-05T17:08:17+02:00

Jul 5, 17:08 CEST
Resolved - Unser Techniker konnte das Problem auf unserer Seite durch Maßnahmen vor Ort beheben. Alle Server sind wieder online und funktionieren wie vorgesehen.

Wir werden in kürze ein Update zu dem Problem veröffentlichen.

Jul 5, 16:51 CEST
Investigating - Derzeit verzeichnen wir Probleme bei der Anbindung einiger VMs. - Update folgt...

DUS3: Sporadische Probleme bei der Verbindung zu einigen VMs

2024-06-23T19:46:21+02:00

Jun 23, 19:46 CEST
Resolved - Die Ursache des Problems wurde gefunden und wird derzeit korrigiert. Mit weiteren Einschränkungen ist nicht zur rechnen.

Wir bitten die entstandenen Unannehmlichkeiten zu entschuldigen.

Jun 23, 19:35 CEST
Monitoring - Das Problem wurde gefunden und gelöst. Alle VMs starten wieder. - Update folgt...

Jun 23, 19:32 CEST
Identified - Das Problem entsteht in einem Teil der Virtualisierungsumgebung. Wir unsersuchen nun das Problem und dessen Ursache. - Update folgt...

Jun 23, 19:23 CEST
Investigating - Derzeit verzeichnen wir Probleme bei der Anbindung einiger VMs. - Update folgt...

DUS2 + DUS3: Sporadische Probleme bei der Verbindung zu einigen VMs

2024-04-03T19:13:18+02:00

Apr 3, 19:13 CEST
Resolved - Unser Techniker konnte das Problem auf unserer Seite durch Maßnahmen vor Ort beheben. Alle Server sind wieder online und funktionieren wie vorgesehen.

Wir werden diesen und ähnliche Vorfälle kurzfristig, voraussichtlich noch am Freitag, in einem direkten Gespräch mit dem Betreiber analysieren. Ziel dieses Gesprächs wird es sein, die Probleme beim Betreiber des Rechenzentrums und dessen Equipment zu identifizieren und dauerhaft zu beheben.

An dieser Stelle können wir uns leider nur entschuldigen, da der Vorfall außerhalb unseres Einflussbereiches lag.

Apr 3, 18:55 CEST
Update - Das Problem lässt sich nicht aus der Ferne lösen. Techniker von uns und dem Anbieter sind auf dem Weg ins Rechenzentrum. - Update folgt...

Apr 3, 18:41 CEST
Identified - Das Problem entsteht beim Betreiber des Rechenzentrums von dem wir unsere Upstreams beziehen. Die notwendigen Personen sind bereits informiert und die Techniker arbeiten an einer Entstörung. - Update folgt...

Apr 3, 18:29 CEST
Investigating - Derzeit verzeichnen wir Probleme bei der Anbindung einiger VMs. - Update folgt...

DUS2: Dringende Kernel-Updates aufgrund eines Bugs in der IOMMU-Schnittstelle

2024-03-25T07:00:56+01:00

Mar 25, 07:00 CET
Completed - The scheduled maintenance has been completed.

Mar 25, 04:00 CET
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Mar 22, 13:51 CET
Scheduled - Liebe Kundinnen und Kunden,

wir möchten Sie darüber informieren, dass ein kritischer Bug in der IOMMU-Schnittstelle identifiziert wurde, der insbesondere unter Hochlastszenarien und bei der Verwendung aktueller Hardware zu Problemen führen kann. Dieser Bug könnte die Leistung und Stabilität unserer Systeme beeinträchtigen und erfordert daher unsere sofortige Aufmerksamkeit.

Betroffene Dienste: Die Auswirkungen dieses Bugs betreffen hauptsächlich Server und Dienste, die auf aktueller Hardware laufen und hohe Lasten verarbeiten. Dies umfasst, ist aber nicht beschränkt auf, Webhosting-Dienste, Cloud-Infrastrukturen und dedizierte Server.

Maßnahmen: Um sicherzustellen, dass die Integrität und Leistung unserer Dienste nicht beeinträchtigt wird, werden wir dringende Kernel-Updates durchführen. Diese Updates sind notwendig, um den Bug zu beheben und mögliche Auswirkungen auf Ihre Dienste zu minimieren.

Zeitplan und Downtime: Die Updates beginnen sofort. Dank unserer umfassenden Redundanzmaßnahmen erwarten wir keine Beeinträchtigungen Ihrer Dienste während dieser Wartungsarbeiten. Wir haben Vorkehrungen getroffen, um einen reibungslosen Übergang und die kontinuierliche Verfügbarkeit Ihrer Services sicherzustellen.

Support: Unser technisches Support-Team steht Ihnen für Fragen und Unterstützung zur Verfügung. Kontaktieren Sie uns bitte über die üblichen Kanäle, sollte Ihnen etwas unklar sein oder sollten Sie Hilfe benötigen.

Wir verstehen, dass Wartungsarbeiten Unannehmlichkeiten verursachen können, und danken Ihnen für Ihr Verständnis und Ihre Kooperation. Die Sicherheit und Leistungsfähigkeit Ihrer Dienste haben für uns oberste Priorität. Wir werden alles in unserer Macht Stehende tun, um die Auswirkungen dieser notwendigen Wartungsarbeiten zu minimieren.

Mit freundlichen Grüßen,
Ihr Team von rack::SPEED

DUS2: Dringende Kernel-Updates aufgrund eines Bugs in der IOMMU-Schnittstelle

2024-03-22T16:15:56+01:00

Mar 22, 16:15 CET
Completed - The scheduled maintenance has been completed.

Mar 22, 12:15 CET
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Mar 22, 12:04 CET
Scheduled - Liebe Kundinnen und Kunden,

wir möchten Sie darüber informieren, dass ein kritischer Bug in der IOMMU-Schnittstelle identifiziert wurde, der insbesondere unter Hochlastszenarien und bei der Verwendung aktueller Hardware zu Problemen führen kann. Dieser Bug könnte die Leistung und Stabilität unserer Systeme beeinträchtigen und erfordert daher unsere sofortige Aufmerksamkeit.

Betroffene Dienste: Die Auswirkungen dieses Bugs betreffen hauptsächlich Server und Dienste, die auf aktueller Hardware laufen und hohe Lasten verarbeiten. Dies umfasst, ist aber nicht beschränkt auf, Webhosting-Dienste, Cloud-Infrastrukturen und dedizierte Server.

Maßnahmen: Um sicherzustellen, dass die Integrität und Leistung unserer Dienste nicht beeinträchtigt wird, werden wir dringende Kernel-Updates durchführen. Diese Updates sind notwendig, um den Bug zu beheben und mögliche Auswirkungen auf Ihre Dienste zu minimieren.

Zeitplan und Downtime: Die Updates beginnen sofort. Dank unserer umfassenden Redundanzmaßnahmen erwarten wir keine Beeinträchtigungen Ihrer Dienste während dieser Wartungsarbeiten. Wir haben Vorkehrungen getroffen, um einen reibungslosen Übergang und die kontinuierliche Verfügbarkeit Ihrer Services sicherzustellen.

Support: Unser technisches Support-Team steht Ihnen für Fragen und Unterstützung zur Verfügung. Kontaktieren Sie uns bitte über die üblichen Kanäle, sollte Ihnen etwas unklar sein oder sollten Sie Hilfe benötigen.

Wir verstehen, dass Wartungsarbeiten Unannehmlichkeiten verursachen können, und danken Ihnen für Ihr Verständnis und Ihre Kooperation. Die Sicherheit und Leistungsfähigkeit Ihrer Dienste haben für uns oberste Priorität. Wir werden alles in unserer Macht Stehende tun, um die Auswirkungen dieser notwendigen Wartungsarbeiten zu minimieren.

Mit freundlichen Grüßen,
Ihr Team von rack::SPEED

DUS2 + DUS3: Sporadische Probleme bei der Verbindung zu einigen VMs

2024-03-13T15:02:48+01:00

Mar 13, 15:02 CET
Resolved - Das Problem entstand an einem der Router des Betreibers des Rechenzentrums. Das betroffene Gerät wurde deaktiviert und wird nun genauer untersucht. Alle Server sind wieder wie gewohnt erreichbar.

Wir bitte die entstandenen Unannehmlichkeiten zu entschuldigen.

Mar 13, 14:58 CET
Identified - Das Problem entsteht beim Betreiber des Rechenzentrums von dem wir unsere Upstreams beziehen. Die notwendigen Personen sind bereits informiert und die Techniker arbeiten an einer Entstörung. - Update folgt...

Mar 13, 14:53 CET
Investigating - Derzeit verzeichnen wir Probleme bei der Anbindung einiger VMs. - Update folgt...

DUS2: Sporadische Probleme bei der Verbindung zu einigen VMs

2024-03-07T13:01:48+01:00

Mar 7, 13:01 CET
Resolved - Das Problem wurde behoben und alle betroffenen Instanzen wurden neu gestartet.

Mar 7, 12:26 CET
Identified - Das Problem konnte auf einen Storage Server eingegrenzt werden und wir sind bereits an der dauerhaften Lösung des Problems.
Update folgt...

DUS2: Sporadische Probleme bei der Verbindung zu einigen VMs

2024-03-06T23:06:43+01:00

Mar 6, 23:06 CET
Resolved - Alle betroffenen VMs arbeiten wieder wie erwartet.

Wir bitten die entstandenen Unannehmlichkeiten zu entschuldigen und wünschen einen schönen Abend.

Mar 6, 22:45 CET
Monitoring - Ein bestehendes Problem wurde vom RAID-Controller nicht korrekt erkannt. Durch einen manuellen Eingriff konnte das Problem dauerhaft gelöst werden. - Alle VMs werden in Kürze wieder zur gewohnten Leistung zurückkehren.

Mar 6, 22:38 CET
Identified - Das Problem konnte auf einen Storage Server eingegrenzt werden. - Update folgt...

Mar 6, 22:16 CET
Investigating - Derzeit verzeichnen wir eine Störung der Verbindung einiger VMs. - Update folgt...

Probleme beim Login

2024-02-12T17:54:53+01:00

Feb 12, 17:54 CET
Resolved - This incident has been resolved.

Feb 12, 10:40 CET
Monitoring - In vereinzelten Fällen kommt es zu einer Fehlermeldung beim Aufruf unseres Kundencenters unter https://kunden.rackspeed.de/.

Sollten Sie mit der Meldung "Oops! - Something went wrong and we couldn't process your request." begrüßt werden nutzen Sie bitte eine der 3 Möglichkeiten um das Problem zu lösen:

- Login über einen andern Browser
- Aktivierung des Inkognito-Modus
- Löschung des Browser-Caches

Ursache der Störung ist ein fehlerhaftes Cookie.

Wir bitten Sie die entstandenen Unannehmlichkeiten zu entschuldigen und bedanken uns für Ihre Mitarbeit.

DUS2 + DUS3: Wartungsarbeiten Außenanbindung

2023-12-19T06:00:33+01:00

Dec 19, 06:00 CET
Completed - The scheduled maintenance has been completed.

Dec 19, 02:00 CET
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Dec 13, 11:52 CET
Scheduled - Der Betreiber unseres Rechenzentrums teil folgendes mit:

"Im o.g. Zeitraum werden wir die Bandbreiten-Kapazitäten unsere Routing-Infrastruktur erweitern. Dazu werden die Core-Router an unserem Standort in Düsseldorf ausgetauscht. Da diese Arbeiten weitgehende Änderungen am Routing mit sich bringen, kann es in dem o.g. Zeitfenster zu Unterbrechungen der Internetverbindung kommen. Die Transport-Strecken zu den Dritt-Rechenzentren (z.B. für Backup-Systeme) werden in dieser Zeit weiterhin zur Verfügung stehen."

Aus unserer Perspektive betrachtet wird der Internetanschluss des Rechenzentrums mehrfach ein- und ausgeschaltet. Störungen auf unserer Seite und / oder den Systemen unserer Kunden sind daher zu 100% ausgeschlossen.

Bitte planen Sie den Vorgang auf Ihrer Seite entsprechend ein. Selbstverständlich steht von unserer Seite ebenfalls ein Techniker in Bereitschaft bereit der den Vorgang begleiten und überwachen wird.

Wir bitten die entstehenden Unannehmlichkeiten zu entschuldigen.

Störung im IP Netz 185.147.219.0/24

2023-09-04T20:33:07+02:00

Sep 4, 20:33 CEST
Resolved - Das Problem wurde vom Lieferanten gefunden und behoben. Das IP Netz ist wieder uneingeschränkt erreichbar.

Sep 4, 20:14 CEST
Identified - Das oben genannte IP Netz ist aktuell aufgrund einer Störung schwer bis garnicht erreichbar. Betroffen sind alle Kunden mit einem Server aus diesem IP Netz. Die Ursache wird bereits gesucht, sodass schnellstmöglich eine Lösung herbeigeführt wird.
Da die Störung bei einem Lieferanten von rackSPEED auftritt, können wir aktuell keine Informationen zur Dauer geben und warten gerade selber auf ein Update.

DUS1: Dringende Wartungsarbeiten / Außenanbindung

2023-08-15T23:00:51+02:00

Aug 15, 23:00 CEST
Completed - The scheduled maintenance has been completed.

Aug 15, 22:02 CEST
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Aug 15, 20:35 CEST
Update - We will be undergoing scheduled maintenance during this time.

Aug 15, 20:26 CEST
Update - We will be undergoing scheduled maintenance during this time.

Aug 15, 20:21 CEST
Scheduled - Soeben ist die Replikation des Firewall-Pärchens in DUS1 ausgefallen. Da sich die Replikation im laufenden Betrieb nicht reparieren lässt haben wir uns dazu entschlossen heute Abend dringende Wartungsarbeiten durchzuführen. Dies ist notwendig um die Redundanz der Anbindung aufrechtzuerhalten, derzeit ist dies nicht möglich da die Konfigurationen der beiden Firewalls nicht mehr synchronisiert werden können. Fällt nun die aktive Firewall aus kann das Ersatzgerät nicht automatisch übernehmen.

Aufgrund der zuvor beschriebenen Probleme ist ein "Rollen-Tausch" vor Beginn der Wartungsarbeiten nicht möglich, wir müssen den Standort kurz kontrolliert vom Netz nehmen. Es wird somit zu kurzen Unterbrechungen in der Erreichbarkeit kommen, sobald die Anbindung wiederhergestellt wurde funktionieren alle Services wie zuvor da an den Servern selber keinerlei Veränderung stattfindet.

Insgesamt sind von dieser Maßnahme ca. 20% unserer Systeme betroffen, 80% der Systeme stehen in DUS2 und sind nicht betroffen. Die Systeme in DUS2 werden daher ohne Unterbrechung durchgehend erreichbar sein.

Wir sind bemüht die Beeinträchtigungen so kurz wie möglich zu halten und bedanken uns schon jetzt für Ihr Verständnis.

DUS1: Packetloss und sporadische Probleme bei der Verbindung

2023-03-28T22:40:19+02:00

Mar 28, 22:40 CEST
Resolved - Beide Firewalls haben sich synchronisiert und melden einen grünen Status. Die genaue Ursache werden wir morgen untersuchen, ggf. folgt ein kurzes Update zur genauen Ursache sofern diese sich noch herausfinden lässt.

Die Störung bitten wir zu entschuldigen und wünschen eine gute Nacht.

Mar 28, 22:23 CEST
Update - Die Anbindung wurde wiederhergestellt, alle Systeme sind wieder online.

Mar 28, 22:19 CEST
Monitoring - Beide Firewalls zeigten eine Störung an und wurden neugestartet. - Update folgt...

Mar 28, 22:18 CEST
Update - Beide Firewalls zeigten eine Störung an und wurden neugestartet. - Update folgt...

Mar 28, 22:01 CEST
Identified - Ursache der Störung scheinen unsere Firewalls zu sein, ein Techniker ist auf dem Weg ins Rechenzentrum. - Update folgt...

Mar 28, 21:53 CEST
Investigating - Derzeit verzeichnen wir eine Störung der Anbindung eines Rechenzentrums. - Update folgt...

Störung eines Storage-Servers (FS1006)

2022-11-24T17:26:27+01:00

Nov 24, 17:26 CET
Resolved - Das Storage-System konnte ohne weitere Zwischenfälle oder Datenverlust evakuiert werden. Alle betroffenen Server liegen nun auf neuen Geräten und arbeiten ohne Auffälligkeiten. - Wir beenden unseren Einsatz an dieser Stelle und wünsche einen schönen Abend.

Nov 24, 06:31 CET
Update - Die Evakuierung des Storage Servers läuft weiterhin nach Plan, 80% der Daten wurden bereits verschoben. Wir sind guter Dinge den Vorgang am späten Vormittag komplett abschließen zu können. - Update folgt...

Nov 23, 21:05 CET
Monitoring - Die Evakuierung des Storage Servers läuft nach Plan und schreitet schnell voran. - Update folgt...

Nov 23, 18:04 CET
Identified - Soeben ist zusätzlich ein Compute-Node ausgefallen, hierbei kam es bei einer Hand voll VMs einer Unterbrechung der Services. Alle VMs wurden auf andere Compute-Nodes migriert und laufen bereits wieder. Die Migration des Storage-Servers läuft nach wie vor. - Update folgt...

Nov 23, 16:37 CET
Monitoring - Die Migration der betroffenen Kundendaten läuft nun mit maximaler Geschwindigkeit, dies führt vereinzelt zu einer schlechteren Antwortzeit der Dienste und kurzen Störungen in der Erreichbarkeit. Dieser Zustand wird sich mit jeder geretteten VM im Laufe des Abends nach und nach verbessern.

Bisher gab es keine weiteren Besonderen Vorkommnisse, wenn dies so bleibt können wir die Arbeiten in der Nacht abschließen. - Update folgt...

Nov 23, 15:06 CET
Identified - Das Problem konzentriert sich auf einen Storage-Server welcher droht in Kürze auszufallen. Wir bereiten nun die Evakuierung der betroffenen VMs vor und starten kurzfristig mit den notwendigen Arbeiten. - Update folgt...

Nov 23, 14:52 CET
Investigating - Unser Monitoring meldet vereinzelt Probleme bei der Performance von ca. 80 VMs. Wir untersuchen den Fall bereits und werden kurzfristig weitere Infos veröffentlichen. - Update folgt...

Ausfall eines Storage-Servers (FS1001)

2022-09-12T12:34:29+02:00

Sep 12, 12:34 CEST
Resolved - Abschließend wurden alle betroffenen Server und Dienste überprüft um versteckte Fehler ausschließen zu können. Wir beenden unseren Einsatz an dieser Stelle und wünschen Ihnen einen schönen Tag.

Sep 12, 11:56 CEST
Monitoring - Auf einigen Compute-Nodes wurde der ausgefallene Storage-Server nicht korrekt erkannt. Dies führte dazu das einige Verbindungen offen geblieben sind wodurch ein erneuter Verbindungsaufbau verhindert wurde. Nachdem die Verbindungen manuell beendet wurden stellten die Server automatisch alle fehlenden Verbindungen wieder her.

Sep 12, 11:06 CEST
Identified - Das Problem konzentriert sich auf einen Storage-Server welcher soeben ohne Vorwarnung ausgefallen ist. Nach einem Reboot scheint das System nicht ganz rund zu laufen, die meisten VMs sind allerdings bereits wieder online. - Update folgt...

Sep 12, 10:50 CEST
Investigating - Derzeit verzeichnen wir vereinzelt Probleme bei der Erreichbarkeit einiger VMs. - Update folgt...

DUS2: Packetloss und sporadische Probleme bei der Verbindung

2022-08-20T19:33:00+02:00

Aug 20, 19:33 CEST
Resolved - Das Problem ist gelöst und alle Services sind wieder uneingeschränkt erreichbar. Es wird nun geprüft wie es dazu kommen konnte und was in Zukunft unternommen werden kann damit dies nicht wieder auftritt. Wir entschuldigen uns für die Störung und beenden unseren Einsatz.

Aug 20, 19:06 CEST
Monitoring - Durch einen Fehler im Routing funktionierte die automatische Umschaltung des DDoS-Schutzes nicht korrekt. Hierdurch kam es zu einer vorübergehenden Störung der Anbindung. Das Problem sollte nun gelöst sein. - Update folgt...

Aug 20, 18:55 CEST
Identified - Das Problem entsteht im Rechenzentrum bei unserem Partner der die Anbindung ans Internet übernimmt. Wir können somit leider nicht aktiv an der Entstörung mitwirken und bitten unsere Kunden daher um etwas Geduld. Ein Team von Technikern ist bereits vor Ort im Einsatz um die Störung zu analysieren und kurzfristig zu beheben. - Update folgt...

Aug 20, 18:40 CEST
Investigating - Derzeit verzeichnet unser Monitoring Packetloss und sporadische Probleme bei der Verbindung zu DUS2. - Update folgt.

DUS2: Packetloss und sporadische Probleme bei der Verbindung

2022-08-18T08:01:13+02:00

Aug 18, 08:01 CEST
Resolved - Soeben kam die Entwarnung des Partners vor Ort per Telefon, das Problem ist unter Kontrolle und gelöst. Es wird nun geprüft wie es dazu kommen konnte und was in Zukunft unternommen werden kann damit dies nicht wieder auftritt. Wir entschuldigen uns für die Störung und beenden unseren Einsatz.

Aug 18, 07:36 CEST
Monitoring - Durch einen Fehler im Routing kam es zu einer vorübergehenden Störung der Anbindung. Das Problem sollte nun gelöst sein. - Update folgt...

Aug 18, 07:16 CEST
Identified - Das Problem entsteht im Rechenzentrum bei unserem Partner der die Anbindung ans Internet übernimmt. Wir können somit leider nicht aktiv an der Entstörung mitwirken und bitten unsere Kunden daher um etwas Geduld. Ein Team von Technikern ist bereits vor Ort im Einsatz um die Störung zu analysieren und kurzfristig zu beheben. - Update folgt...

Aug 18, 07:06 CEST
Investigating - Derzeit verzeichnet unser Monitoring Packetloss und sporadische Probleme bei der Verbindung zu DUS2. - Update folgt.

Ausfall eines Storage-Servers (FS1002)

2021-12-21T16:14:04+01:00

Dec 21, 16:14 CET
Resolved - Alle betroffenen Systemen wurden wiederhergestellt! Wir werden den Fall an dieser Stelle schließen und melden uns in Kürze mit einem ausführlichen Report zurück.

Sollten Sie dennoch Fehler bemerken öffnen Sie bitte ein Support-Ticket (https://rackspeed.de/go/support) in unserem Kundencenter, wir schauen uns dieses morgen früh zuerst an.

Wie immer werden wir unsere Schlüsse aus dem Vorfall ziehen und uns fürs nächste Mal besser aufstellen. Sobald es Neuigkeiten gibt berichten wir in unserem Blog darüber.

Wir möchten uns an dieser Stelle noch einmal ausdrücklich für das große Verständnis und Mitgefühl einiger Kunden bedanken.

Dec 21, 00:38 CET
Update - Leider mussten wir feststellen das nicht alle Server sauber wiederhergestellt werden konnten. Dies liegt zum einen an riesigen Datenmengen oder gewaltigen vielen Dateien auf einem Server, letzteres resultiert meistens aus fehlerhaft konfigurierten Cronjobs. In seltenen Fällen scheinen Backups nicht korrekt erstellt worden zu sein, die Ursache hierfür sind Fehler in den Datenbanken die einen sauberen Dump verhindern. - Wir suchen derzeit nach Sicherungen früherer Daten die diese Fehler nicht aufweisen.

Da nun die Wartungs- und Backup-Jobs der Server laufen dauert sowohl die Suche als auch die erneute Wiederherstellung länger.

Wir versichern Ihnen das wir unser Bestes geben die noch verbliebenen Störungen zu korrigieren. Aufgrund er zuvor beschriebenen Umstände wird es bei diesen Kunden sehr wahrscheinlich bis morgen früh dauern bis diese VMs wieder erreichbar sind.

Wir bedanken uns für Ihr Verständnis und melden uns wieder sobald es neue Infos gibt.

Dec 20, 21:17 CET
Monitoring - Alle betroffenen Systeme wurden wiederhergestellt. Sollten Sie dennoch Fehler bemerken öffnen Sie bitte ein Support-Ticket (https://rackspeed.de/go/support) in unserem Kundencenter, wir schauen uns dieses morgen früh zuerst an.

Dec 20, 17:44 CET
Update - Wir liegen in den letzten Zügen und gehen erst in den Feierabend wenn alles wieder erreichbar ist!
Kleinere Nacharbeiten führen wir gerne morgen mit unseren Kunden zusammen durch.

Aktuell glühen sowohl die Backup-Server, als auch die Netzwerkverbindungen Richtung neue Server und VMs. Wir und unsere Technik geben unser Bestes damit die Daten so schnell wie möglich wieder erreichbar sind, aktuell kratzen wir allerdings an mehreren physikalischen Grenzen die wir nicht "mal eben" erweitern können.

Update folgt...

Dec 20, 12:51 CET
Update - Die meisten VMs sind erst einmal wieder online, es bleibt noch eine hand-voll übrig die einen schwerwiegenden Schaden am Dateisystem erlitten hat. Diese VMs werden in Kürze aus den Backups wiederhergestellt da eine Rettung nicht mehr möglich ist.

Sobald diese Vorgänge abgeschlossen wurden werden wir das betroffene Storage-System komplett evakuieren und außer Betrieb setzen. - Update folgt...

Dec 20, 08:35 CET
Identified - Das Problem konzentriert sich auf einen Storage-Server und auf den dort laufenden Rebuild des defekten RAID-Arrays. Wir versuchen gerade herauszufinden was genau schief läuft, die defekte Disk wurde vom System wie erwartet ausgetauscht dennoch gibt es derzeit massive Probleme mit dem System. - Update folgt...

Dec 20, 08:03 CET
Investigating - Derzeit verzeichnen wir vereinzelt Probleme bei der Erreichbarkeit einiger VMs.

CVE-2021-44228 (Log4Shell) - Sicherheitslücke im Java-Logging log4j

2021-12-13T18:40:30+01:00

Dec 13, 18:40 CET
Completed - The scheduled maintenance has been completed.

Dec 13, 10:40 CET
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Dec 13, 10:38 CET
Scheduled - Die Sicherheitslücke ist uns bekannt, daher untersuchen und patchen wir derzeit bei uns installierte verwundbare Installationen. In diesem Zusammenhang wird es zu Unterbrechungen des Betriebs kommen, eine Terminvergabe ist aufgrund der kritischen Einstufung des Problems nicht möglich.

Genaue Informationen zur betroffenen Software, unseren Gegenmaßnahmen und weitere Details werden wir aufgrund der akuten Gefährdungslage derzeit nicht veröffentlichen. Wir bitten Sie daher von Nachfragen diesbezüglich abzusehen.

Des Weiteren werden wir eingehende Support-Anfragen nicht persönlich beantworten und mit einem Verweis auf diesen Eintrag schließen.

Zu späterer Zeit werden wir hier genauere Infos veröffentlichen.

Wir bedanken und für Ihr Verständnis und versichern alles notwendige zu unternehmen um unsere Infrastruktur und Ihre Daten zu schützen.

Spontane Probleme in der Erreichbarkeit einzelner Server

2021-11-08T10:31:41+01:00

Nov 8, 10:31 CET
Resolved - Das Netzwerk läuft wieder stabil, das Problem ist damit gelöst. Die genaue Ursache werden wir nun in Ruhe analysieren und den Switch ggf. austauschen.

Wir entschuldigen uns für die entstandenen Unannehmlichkeiten und wünschen einen guten Start in die Woche. Mit weiteren Einschränkungen ist nicht zu rechnen.

Nov 8, 09:20 CET
Monitoring - Das Problem konnte auf einen Switch eingegrenzt werden. Wir haben diesen isoliert und leiten die Daten nun ausschließlich über den redundanten Partner weiter. Das Problem sollte dadurch gelöst sein. - Update folgt...

Nov 8, 08:31 CET
Identified - Das Problem kann auf ein spezielles Rack eingegrenzt werden. Wir untersuchen nun das Netzwerk. - Update folgt...

Nov 8, 08:25 CET
Investigating - Derzeit verzeichnen wir Probleme in der Erreichbarkeit einzelner Kunden. Wir untersuchen den Fall. - Update folgt...

Kritisches Apache 2.4 Update (CVE-2021-41773 und CVE-2021-42013)

2021-10-08T21:01:29+02:00

Oct 8, 21:01 CEST
Completed - Die Updates wurden fehlerfrei auf allen Systemen installiert. - Wir können unseren Einsatz vorzeitig beenden.

Oct 8, 19:48 CEST
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Oct 8, 19:47 CEST
Scheduled - Soeben wurde ein kritisches Update für den Apache 2.4 Webserver (CVE-2021-41773 und CVE-2021-42013) veröffentlicht. Die Updates werden ab sofort auf den betroffenen Servern installiert, mit Einschränkungen des Produktivbetriebs wird nicht gerechnet.

DUS1: Dringende Wartungsarbeiten / Außenanbindung

2021-07-21T01:00:35+02:00

Jul 21, 01:00 CEST
Completed - The scheduled maintenance has been completed.

Jul 20, 22:57 CEST
Verifying - Es konnten alle Arbeiten ohne Probleme und wesentlich schneller als geplant umgesetzt werden. Wir beobachten das neue Firewall-Pärchen noch ein wenig und werden dann die Wartungsarbeiten vorzeitig abschließen.

Insgesamt waren die Verbindungen für knapp 3 Minuten offline, weitere Unterbrechungen wird es nicht mehr geben.

Jul 20, 22:01 CEST
In progress - Scheduled maintenance is currently in progress. We will provide updates as necessary.

Jul 20, 10:14 CEST
Scheduled - Heute Nacht kam es zu einem kurzen Aussetzer der Außenanbindung. Während der Ursachenanalyse stellte sich heraus das beide Firewalls bereits seit mehreren Tagen Probleme aufzeichnen die langsam aber sicher größer werden und in Kürze zu einem Totalausfall, trotz Redundanz, führen werden.

Wir haben uns daher entschlossen den Austausch der Hardware welcher für Herbst geplant war auf heute Nacht vorzuziehen. Während der Wartungsarbeiten werden wir das bestehende Firewall-Pärchen ausbauen und durch ein neues ersetzen. Aufgrund der zuvor beschriebenen Probleme ist ein "Online-Austausch" nicht mehr möglich, es wird somit zu kurzen Unterbrechungen in der Erreichbarkeit kommen.

Insgesamt sind von dieser Maßnahme ca. 60% unserer Systeme betroffen, 40% der Systeme sind nicht betroffen und werden daher ohne Unterbrechung durchgehend erreichbar sein.

Wir sind bemüht die Beeinträchtigungen so kurz wie möglich zu halten und bedanken uns schon jetzt für Ihr Verständnis.

Störung der Telefonanlage

2021-07-06T17:57:34+02:00

Jul 6, 17:57 CEST
Resolved - Die Telefone funktionieren wieder fehlerfrei. Ab sofort sind wir telefonisch wieder erreichbar.

Jul 6, 17:53 CEST
Monitoring - Das Problem wurde laut dem Anbieter gelöst. - Update folgt...

Jul 6, 16:13 CEST
Identified - Das Problem ist bereits beim Anbieter bekannt und wird derzeit gelöst. Wir bitten unsere Kunden daher in der Zwischenzeit Anfragen per Support-Ticket (https://rackspeed.de/go/support) an uns zu richten, Neukunden benutzen bitte das Kontaktformular der Website oder senden Ihre Anfrage direkt an info@rackspeed.de Wir bedanken uns für Ihr Verständnis. - Update folgt...

Jul 6, 15:26 CEST
Investigating - Derzeit erreichen uns eMails mit dem Hinweis das unsere Telefone nicht erreichbar sind. - Update folgt...

DUS1: Störungen der Verbindungen vom DE-CIX

2021-05-19T15:30:22+02:00

May 19, 15:30 CEST
Resolved - Das Problem wurde von HKN nachhaltig gelöst, wir beenden unseren Einsatz daher.

Auch wenn die Ursache der Probleme nicht in unserem Einflussbereich lag möchten wir uns ausdrücklich dafür entschuldigen. Wir werden im Nachgang mit unserem Anbindungspartner über die genaue Ursache der Störung sprechen und überprüfen ob wir bei diesem Thema etwas verbessern können.

May 19, 15:10 CEST
Monitoring - Die Verbindungen sind wieder uneingeschränkt erreichbar. Wir beobachten das Verhalten noch etwas länger, Update folgt...

May 19, 15:09 CEST
Identified - Das Problem entsteht außerhalb unseres Einflussbereiches beim Anbindungspartner HKN. Das Support-Team des Anbieters untersucht das Problem bereits und sorgt kurzfristig für eine Lösung. - Update folgt...

May 19, 14:56 CEST
Investigating - Derzeit berichten einige Kunden und unser Monitoring von Störungen der Verbindungen zu einem unserer Standorte DUS1. Wir untersuchen das Problem, Update folgt...