Wer ist betroffen?
Falls Sie folgende Fragen mit “Ja” beantworten können, sollten Sie weiterlesen:
- Setzen Sie Azure App Service ein?
- Hat ein Ausfall für Ihre Firma bzw. Kunden einen hohen Business Impact?
Was bedeutet die Änderung?
Bis zum 31. März 2025 wurde bei Ausfall einer Region die Applikation in einen Disaster Recovery Modus versetzt und in einer anderen Region temporär zur Verfügung gestellt. Dies schützte Kunden vor Datenverlust und sicherte die Businesskontinuität. Diese Verantwortung liegt nun bei Ihnen. Mit dieser Verantwortung stellt sich nun die Frage, wie weiter vorzugehen ist.
Cloud Services
Nutzen Sie das volle Potenzial für Ihr Unternehmen
Wie auf die Änderung reagieren?
1. Kritische Komponenten und Workloads identifizieren
Bei dieser Änderung liegt der Fokus nur auf Azure App Service. Ein System besteht jedoch aus mehr als nur Azure App Service; meistens sind noch andere Dienste betroffen, die in der gleichen Region laufen und ebenfalls von einem Ausfall betroffen wären (z.B. Datenbanken). Daher empfiehlt es sich, für die Disaster Recovery Strategie das System als Ganzes zu betrachten.
Falls Sie sich interessieren, wie Sie bei diesem Schritt vorgehen sollten können Sie hier noch mehr dazu lesen.
2. Disaster Recovery Strategie entwickeln und umsetzen
Abhängig von den Anforderungen eine geeignete Disaster Recovery Strategie auswählen und umsetzen.
3. Disaster Recovery Strategie testen und trainieren
Durch Simulationen von Ausfällen wird die Strategie getestet und das Team lernt, mit solchen Situationen umzugehen und besser zu werden.
Mögliche Ansätze für Disaster Recovery Strategie
Zonen-Redundanz
Je nach Anforderungen reicht eventuell schon eine zonen-redundante Verfügbarkeit. Bei diesem Feature von Azure App Service werden bei Ausfall einer Zone die Anfragen automatisch auf eine andere Zone umgeleitet. Voraussetzung hierfür ist der Einsatz von mindestens einem Premium v3 App Service Plan und mindestens eine Instanz pro Zone, also insgesamt drei Instanzen. Microsoft empfiehlt für Produktionsumgebungen dieses Feature zu aktivieren. Damit erhalten Sie eine SLA von 99,99% (Ausfallzeit von weniger als 1h pro Jahr). Ohne Zonen-Redundanz liegt diese bei mindestens 99,95% (entspricht einem Ausfall von ca. 4,4h pro Jahr).
Active-Passive Configuration oder Active-Active Configuration
Reicht das jedoch nicht aus, können mehrere Regionen sinnvoll sein. Dies kann zum Beispiel mittels Active-Passive Configuration oder Active-Active Configuration geschehen. Damit wird die Applikation in zwei Regionen zur Verfügung gestellt. Während bei der Active-Active Configuration beide Regionen aktiv Anfragen annehmen und bearbeiten, ist bei der Active-Passive Configuration nur eine aktiv, und die zweite ist im Standby-Modus und kommt erst bei Ausfall der Primärregion zum Einsatz.
Gute Qualität zahlt sich aus
Software Quality Map
Was sind nun die Tradeoffs?
Mit der höheren Verfügbarkeit kommen viele Vorteile, jedoch muss man auch gewisse Kompromisse gegenüber anderen Qualitätsanforderungen eingehen. Auf Basis von Well Architected Framework lassen sich folgende ableiten:
Security
- Mit der Redundanz sowie auch zusätzlichen benötigten Komponenten vergrössert sich auch die Angriffsfläche.
- Kommt es zur Notsituation, will man schnell reagieren. Während des Troubleshootings kann man dazu neigen, gewisse Sicherheitsvorkehrungen temporär zu deaktivieren. Dies kann zu hohen Sicherheitsrisiken führen.
Kosteneffizienz & Nachhaltigkeit
- Mit der Redundanz und den zusätzlich benötigten Komponenten steigen auch die Kosten und sinkt die Nachhaltigkeit der Lösung. Zu den Komponenten gehört auch das Netzwerk, das gerne übersehen wird. Hierzu gibt es einen sehr interessanten Artikel, den es hier zu lesen gibt.
- Ein weiterer Ansatz, um die Verfügbarkeit und die Reaktion auf höhere Last zu gewährleisten, ist eine Überprovisionierung. Wieder entstehen hier höhere Kosten und die Nachhaltigkeit sinkt.
- Um die Verfügbarkeit des Systems zu gewährleisten, benötigt es ein umfassendes Monitoring, was wiederum zu höheren Kosten führt.
- Je nach aktueller Konfiguration kann dies eine Kostensteigerung von 200-300% für Azure App Service bedeuten.
Operational Excellence
- Die erhöhte Verfügbarkeit birgt auch eine erhöhte Komplexität der Lösung. Damit wird ebenfalls die Wartung und Operation der Lösung für das Team erschwert.
- Damit verbunden ist ein erhöhtes Wissen für die Operation der Lösung. Das Onboarding von neuen Mitarbeitern wird erschwert.
Performance Efficiency
Die hohe Verfügbarkeit kann jedoch auch einen positiven Einfluss haben. Die Last kann besser verteilt werden und bei geografischer Verteilung zu geringeren Latenzzeiten führen.
Sie möchten sich mit einem Experten zu dem Thema oder generell über Cloud Services austauschen? Shpend Kelmendi freut sich auf Ihre Nachricht.

Der Experte
Shpend Kelmendi
Shpend Kelmendi ist Software Engineer bei bbv mit Schwerpunkt im Cloud- und Web-Bereich und Cloud-Community-Lead. In dieser Funktion setzt er vor allem auf offene Kommunikation, Teamarbeit sowie auf die Entwicklung einfacher, qualitativ nachhaltiger und kundenorientierter Lösungen.