Disaster Recovery
Disaster Recovery (DR) ist der technische Teil der Krisenvorsorge: Wie stellen wir Daten und Systeme nach einem katastrophalen Ereignis (Feuer, Flut, massiver Cyberangriff) wieder her? Business Continuity (BC) ist die strategische Ebene: Wie halten wir den Geschäftsbetrieb während des Ausfalls aufrecht?
Es geht um die Existenzsicherung des Unternehmens. Eine IT ohne funktionierenden und geprüften DR-Plan ist ein unverantwortliches Geschäftsrisiko.
Anti-Patterns: Die fatale Hoffnung
Viele Unternehmen glauben, "ein Backup zu haben" sei ausreichend. Doch im Ernstfall stellt sich oft heraus, dass die Wiederherstellung Tage dauert, wichtige Daten fehlen oder die Hardware zur Wiederherstellung gar nicht verfügbar ist. Ohne definierte Zeitziele (RTO) und Datenverlust-Toleranzen (RPO) ist die IT im Krisenfall führungslos.
Definierte Sicherheit
- RPO (Recovery Point Objective): Wie viel Datenverlust können wir verkraften? (z. B. "Maximal 1 Stunde Arbeit geht verloren").
- RTO (Recovery Time Objective): Wie schnell müssen die Systeme wieder laufen? (z. B. "Nach 4 Stunden ist der Kernbetrieb wieder online").
- 3-2-1 Backup-Regel: 3 Kopien der Daten, auf 2 verschiedenen Medien, 1 Kopie davon an einem externen, physisch getrennten Ort (Off-site).
- Immutable Backups: Sicherungen, die nachträglich nicht mehr verändert oder gelöscht werden können (Schutz vor Ransomware).
- Regelmässige Recovery-Audits: Ein Backup, das nicht erfolgreich wiederhergestellt wurde, existiert faktisch nicht. Wir testen den Ernstfall quartalsweise.
Der Fokus: Die kritischen Prozesse
Nicht alles muss sofort wieder laufen. Wir priorisieren die Wiederherstellung nach dem Business-Impact: Erst der Verkauf und die Logistik, dann die internen administrativen Systeme.
FAQ
Was ist der Unterschied zwischen Backup und Disaster Recovery?
Das Backup ist die Kopie der Daten. Disaster Recovery ist der Plan und die Infrastruktur, um aus diesen Daten wieder ein funktionierendes Gesamtsystem zu machen. Ohne Plan sind Daten nur nutzlose Bytes.
Können wir RTO und RPO nicht einfach auf Null setzen?
Das wäre technisch möglich (High Availability über mehrere Regionen), ist aber extrem teuer. Wir müssen eine ökonomische Balance finden: Was kostet uns eine Stunde Ausfall vs. was kostet uns die Vermeidung dieses Ausfalls?
Reference Guide
- NIST Guide to Contingency Planning: Offizieller Leitfaden für IT-Notfallplanung. nist.gov
- The 3-2-1 Backup Rule: Die Grundlagen der Datensicherung. Veeam Blog
- ISO 22301: Der internationale Standard für Business Continuity Management. iso.org