19. Juli 2024

Globaler IT-Ausfall

Ein fehlerhaftes Update und die halbe Welt steht still.

Der heutige Freitag wird überschattet von einem massiven Ausfall von IT-Systemen weltweit.

Hintergrund ist offenbar ein fehlerhaftes Update des CyberSecurity-Dienstleisters CrowdStrike für dessen Hauptprodukt Falcon. Falcon ist ein Softwaresystem, dass Geräte vor Bedrohungen schützen und im besten Fall auch aktiv dagegen vorgehen können soll.

Aufgrund eines Programmierfehlers, der offenbar auch in der Qualitätssicherung nicht bemerkt wurde, stürzten Windows-Systeme, die mit Falcon ausgestattet waren, nach dem automatischen Einspielen des Updates schlicht ab. Was aber noch deutlich schlimmer ist: Falcon ist tief im Betriebssystem verankert - das muss es auch, damit es seiner Aufgabe nachgehen kann. In diesem Fall aber führte das zu einem sogenannten Bootloop, d.h. betroffene Rechner starteten immer und immer wieder neu, ohne jemals betriebsbereit zu werden. Nur ein manueller Eingriff durch die verantwortlichen Administratoren konnte die Rechner wieder zu einem korrekten Systemstart bewegen.

Betroffen von diesem Desaster waren Schätzungen zufolge etwa 8,5 Millionen Rechner weltweit.

Bemerkenswert an diesem Vorfall ist einerseits die große Zahl an betroffenen Computern und andererseits die Frage, wieso ein solch kapitaler Fehler nicht durch die Qualitätssicherung bei CrowdStrike bemerkt werden konnte.

CrowdStrike wird sich sicherlich einige unangenehmen Fragen stellen lassen müssen.

Glücklicherweise waren die meisten Systeme recht schnell wieder einsatzbereit, nachdem CrowdStrike eine Anleitung veröffentlicht hat, um die betroffenen Geräte wiederherzustellen. Die Verzögerungen im weltweiten Flugverkehr werden allerdings sicherlich noch eine Weile andauern.

Einige Kommentatoren hinterfragen bereits, ob der generelle Trend in Richtung Cloud wirklich der richtige Weg ist. Die Frage mag berechtigt sein, allerdings ist der Trend kaum aufzuhalten. Das gesamte Windows-Ökosystem bewegt sich in diese Richtung und das auch nicht erst seit gestern. Ein einzelner Vorfall dieser Art wird daran auch nichts ändern.

Allerdings ist dieser Vorfall sicherlich ein guter Anlass, die eigene IT-Strategie zu prüfen und gegebenenfalls auch kritisch zu hinterfragen - schließlich ist auch Verfügbarkeit üblicherweise ein Schutzziel der Informationssicherheit.