Dokumentationen - Notfallhandbuch

Ein Notfallhandbuch ist ein zentrales Instrument zur Gewährleistung der Betriebskontinuität und zum Management von Krisensituationen.

Es dient als umfassende Referenz, die darauf ausgerichtet ist, Organisationen durch den Prozess der Wiederherstellung und Aufrechterhaltung von Geschäftsabläufen zu leiten, sollte ein unvorhergesehenes Ereignis eintreten.

In seiner Kernfunktion bietet das Handbuch eine strukturierte Vorgehensweise für die Erkennung, Bewertung und Behebung von Notfallsituationen, um die Auswirkungen auf die Geschäftstätigkeit so gering wie möglich zu halten.


Begriffsbestimmung

Im Risikomanagement und der Notfallplanung ist eine klare Unterscheidung zwischen Betriebsstörungen, Notfällen und Katastrophen entscheidend, um angemessene Reaktionsstrategien entwickeln zu können. Jeder dieser Begriffe beschreibt ein unterschiedliches Ausmaß und eine unterschiedliche Art von Störung, die spezifische Maßnahmen erfordert.

Betriebsstörungen

Betriebsstörungen sind Ereignisse, die den normalen Betriebsablauf durch den Ausfall einzelner Komponenten, Softwarefehler oder Fehler im Systemmanagement stören. Diese Ereignisse sind quasi die „täglichen Katastrophen“, die in der Regel nur einzelne Geschäftsprozesse betreffen und mit vorhandenen Betriebsmitteln sowie Standardverfahren behoben werden können. Sie sind charakterisiert durch ihre direkte Auswirkung auf spezifische Betriebsfunktionen und die Möglichkeit einer zeitnahen Lösung.

Betriebsstörungen werden in der Regel intern gemanagt und erfordern keine außergewöhnlichen Maßnahmen zur Behebung. Sollte eine Störung jedoch nicht innerhalb einer festgelegten Zeit behoben werden können, besteht das Risiko einer Eskalation zum Notfall.

Notfälle

Ein Notfall ist eine schwerwiegendere Störung, die zum Ausfall eines gesamten Rechenzentrums oder eines wesentlichen Betriebsbereichs führen kann. Diese Art von Störung hat das Potenzial, den Großteil der Geschäftsfunktionen zu beeinträchtigen und das Weiterbestehen des Unternehmens zu gefährden, insbesondere wenn keine vorbeugenden Maßnahmen für den Wiederanlauf existieren.

Notfälle erfordern umfangreiche Reaktionspläne und oft die Aktivierung spezieller Notfallteams. Sie können eine erhebliche Umstrukturierung der Betriebsabläufe oder den temporären Wechsel zu alternativen Betriebsstätten erforderlich machen.

Katastrophen

Katastrophen sind Ereignisse von noch größerem Ausmaß, die Gebiete weit über das Unternehmen hinaus betreffen, wie ganze Stadtteile, Städte oder Regionen. Die Auswirkungen sind so umfangreich und gravierend, dass die Wiederherstellung des normalen Unternehmensbetriebs in den Hintergrund tritt gegenüber sofortigen Rettungs- und Wiederherstellungsmaßnahmen auf kommunaler oder nationaler Ebene.

In solchen Fällen liegt der Fokus auf der Sicherheit der Mitarbeiter und der Gemeinschaft, und es werden oft externe Ressourcen und staatliche Hilfe benötigt, um mit den Folgen umzugehen.

Nachchstehend liegt der Schwerpunkt ausschließlich auf der Betrachtung von Notfällen. Dies umfasst die Entwicklung von Strategien zur Minimierung der Auswirkungen solcher Ereignisse auf das Unternehmen und zur Sicherstellung einer schnellen Wiederherstellung der operativen Kapazitäten.

Ziel und Zweck eines Notfallhandbuches

Das Notfallhandbuch ist ein essenzieller Bestandteil des Risikomanagements und der Notfallvorsorge einer Organisation. Es gewährleistet, dass die Organisation auf den Ausfall kritischer Komponenten ihrer Betriebsführung vorbereitet ist. Im Fokus stehen dabei die zeitkritischen Geschäftsprozesse, deren kontinuierliche Funktion für die Aufrechterhaltung des Geschäftsbetriebs von zentraler Bedeutung ist. Die Notfallplanung deckt verschiedene Szenarien ab, darunter den Ausfall von Personal, Gebäuden und deren Infrastrukturen, IT-Anwendungen sowie externe Dienstleistungen.

Im Kern des Handbuches steht der Gedanke, dass jeder Prozess und jede Ressource durch spezifische Recovery Time Objectives (RTOs) geschützt werden muss, die in der Business Impact Analyse definiert sind. Diese RTOs geben vor, in welcher Zeit die jeweiligen Prozesse nach einem Ausfall wieder aufgenommen werden müssen, um kritische Geschäftsunterbrechungen zu vermeiden.

Für die verschiedenen Ausfallszenarien werden im Notfallhandbuch detaillierte Maßnahmenpläne formuliert, die die Wiederherstellung des Geschäftsbetriebs sicherstellen sollen:

  • Sofortmaßnahmen
    Diese Maßnahmen werden unmittelbar nach Eintritt eines Notfalls ergriffen, um die Auswirkungen zu minimieren und die wichtigsten Geschäftsprozesse aufrechtzuerhalten.

  • Vorbereitung des Notbetriebs
    Hier werden die Schritte definiert, die erforderlich sind, um den Betrieb unter Notbedingungen fortzusetzen. Dies umfasst die Aktivierung alternativer Betriebsstätten, Kommunikationspläne und die Zuweisung von Ersatzressourcen.

  • Durchführung des Notbetriebs
    In diesem Abschnitt wird beschrieben, wie der Geschäftsbetrieb unter den eingeschränkten Bedingungen des Notbetriebs funktionieren wird. Hierzu gehören alternative Arbeitsmethoden, Änderungen in der Arbeitsverteilung und Priorisierung von Aufgaben.

  • Rückführung in den Normalbetrieb
    Schließlich werden Strategien entwickelt, die es ermöglichen, nach der Stabilisierung der Situation die Geschäftsprozesse wieder in den regulären Betrieb überzuführen. Dazu gehört die sorgfältige Planung der Rückkehr zu den Standardbetriebsprozessen und -standorten sowie die Überprüfung und das Lernen aus dem Notfall.

Aktivierung Notfallplan

Ein Notfall im Unternehmenskontext tritt ein, wenn unvorhergesehene Ereignisse die Fortführung betriebswichtiger Abläufe stören oder gänzlich unterbrechen. Dies kann auf vielfältige Ursachen zurückzuführen sein, wie technische Defekte, Naturkatastrophen oder auch menschliches Versagen. Die Herausforderung besteht darin, dass die betroffenen Geschäftsprozesse oder Ressourcen innerhalb einer definierten Zeit – der maximal tolerierbaren Ausfallzeit nicht in ihrem regulären Modus wiederhergestellt werden können. Diese Zeitspanne bildet die kritische Grenze, bis zu der das Unternehmen einen Ausfall ohne signifikante Schäden ertragen kann.

Zur Bewältigung solcher Krisensituationen werden Notfallpläne entwickelt, die detaillierte Vorgehensweisen für den Wiederanlauf in einen Notbetrieb umfassen. Diese Pläne konzentrieren sich darauf, die betriebliche Kontinuität mit minimalen Ressourcen aufrechtzuerhalten, bis eine vollständige Wiederherstellung möglich ist. Recovery Pläne ergänzen diese Strategie, indem sie konkrete Schritte zur Wiederherstellung der betroffenen Geschäftsprozesse und Ressourcen aufzeigen. Sie beinhalten in der Regel Prioritäten, Verantwortlichkeiten, Kommunikationswege und Abläufe zur effizienten Reaktion auf die Krise.

Zeitkritische Geschäftsprozesse

Die Bestimmung der Wiederanlaufpriorität von Geschäftsprozessen nach einem Notfall basiert auf den Ergebnissen der Business Impact Analyse, die die maximal tolerierbaren Ausfallzeiten und die Notwendigkeit der Aufrechterhaltung bestimmter Geschäftsprozesse bewertet. Entscheidend ist, dass die für die Ausführung zeitkritischer Prozesse erforderlichen Ressourcen innerhalb dieser definierten Zeitspannen wieder zur Verfügung stehen. Die entsprechenden Wiederanlaufzeiten für diese Ressourcen werden als Recovery Time Objectives innerhalb des Notfallplans festgelegt.

Im Falle eines Notbetriebs, in dem Ressourcen möglicherweise begrenzt sind, wird der Fokus auf die Aufrechterhaltung der als zeitkritisch identifizierten Prozesse gelegt. Andere Prozesse, die weniger zeitkritisch sind oder deren Ausfall keine unmittelbaren schwerwiegenden Auswirkungen hat, können für die Dauer des Notbetriebs vorübergehend ausgesetzt oder zurückgestellt werden. Diese Entscheidung basiert auf einer sorgfältigen Abwägung der Bedeutung jedes Prozesses für die Geschäftskontinuität und die Fähigkeit des Unternehmens, seine grundlegenden Dienstleistungen und Funktionen in einer Krisensituation fortzuführen.

Notfallplan

Prinzipien, die für eine gut durchdachte Notfallplanung unerlässlich sind:

  • Gesamtheitliche Betrachtung
    Jedes Notfallhandbuch muss eine umfassende Perspektive einnehmen, die technologische, organisatorische und operationale Aspekte berücksichtigt und sicherstellt, dass alle Facetten der Betriebskontinuität abgedeckt sind.

  • Integration
    Sicherheitsmaßnahmen und Notfallpläne müssen mit bestehenden Unternehmensprozessen und -richtlinien sowie mit externen Partnern und Dienstleistern nahtlos integriert werden, um Konsistenz und Effektivität zu gewährleisten.

  • Wirtschaftlichkeit
    Die Kosten für Notfallmaßnahmen müssen im Verhältnis zum Wert der zu schützenden Informationen und Systeme stehen.

  • Aktualität
    Regelmäßige Überprüfungen und Aktualisierungen des Handbuchs sind entscheidend, um sicherzustellen, dass die enthaltenen Informationen und Verfahren den neuesten Risiken und Entwicklungen Rechnung tragen.

  • Anpassung an den Stand der Technik
    Die im Handbuch beschriebenen Verfahren sollten immer den aktuellen Stand der Technik widerspiegeln und besten Praktiken folgen.

  • Schnelle Erkennung und Reaktion
    Verfahren zur Überwachung und Meldung von Sicherheitsvorfällen müssen etabliert werden, um auf Vorfälle zeitnah reagieren zu können.

  • Überprüfbarkeit und Dokumentation
    Alle Aktionen und Entscheidungen müssen dokumentiert werden, um Transparenz und Nachvollziehbarkeit zu gewährleisten.

  • Klare Verantwortlichkeiten
    Das Handbuch muss deutlich definieren, wer in Krisensituationen für was verantwortlich ist, um effektive und schnelle Entscheidungen zu ermöglichen.

Notfallszenarien

Im Kontext des Notfallmanagements ist es essenziell, zwischen Betriebsstörungen, Notfällen und Katastrophen zu differenzieren, da jede Kategorie unterschiedliche Reaktionen und Maßnahmen erfordert. Ein Notfallhandbuch sollte daher die Definitionen und Reaktionspläne für diese drei Ereignisarten klar darlegen:

Betriebsstörungen

  • Definition
    Betriebsstörungen sind Störungen des DV-Betriebs durch den Ausfall einzelner Komponenten, Softwarefehler oder Fehler im System-Management. Sie gelten als „die täglichen Katastrophen“ und betreffen meist nur einzelne Geschäftsprozesse.

  • Reaktionsplan
    Betriebsstörungen sollten normalerweise mit vorhandenen Betriebsmitteln und Standardabläufen behoben werden können. Im Notfallhandbuch müssen Prozesse und Verantwortlichkeiten für die Behebung solcher Störungen definiert werden.

  • Eskalationskriterium
    Wenn eine Betriebsstörung nicht innerhalb einer definierten Wiederanlaufzeit behoben werden kann, kann sie sich zu einem Notfall ausweiten

Notfälle

  • Definition
    Ein Notfall bezeichnet eine erhebliche Störung, die den Ausfall des gesamten Rechenzentrums oder eines zentralen Gebäudes zur Folge hat. Dies kann die Ausführung eines Großteils der Geschäftsfunktionen verhindern.

  • Reaktionsplan
    Notfälle erfordern außerordentliche Maßnahmen und oft den Einsatz vordefinierter Notfall- und Wiederanlaufpläne. Das Handbuch muss ein klares Prozedere für die Wiederherstellung der Geschäftsaktivitäten an einem Ausweichstandort oder durch alternative Mittel beschreiben.

  • Vorsorgliche Maßnahmen
    Präventive Maßnahmen sind entscheidend, um sicherzustellen, dass das Unternehmen fortbestehen kann. Dazu gehört die Planung von Ausweichstandorten und die Implementierung von Redundanzmechanismen.

Katastrophen

  • Definition
    Katastrophen sind schwerwiegende Ereignisse mit umfassenden Auswirkungen auf ganze Regionen. Die Schäden überschreiten die Kapazitäten eines einzelnen Unternehmens und erfordern eine übergeordnete Koordination.

  • Reaktionsplan
    In solchen Fällen müssen Unternehmen oftmals mit Behörden und Organisationen auf regionaler oder nationaler Ebene zusammenarbeiten. Die Prioritäten liegen dabei nicht allein auf der Wiederherstellung des Unternehmens, sondern auch auf der Sicherheit der Mitarbeiter und der Öffentlichkeit.

  • Vorbereitung
    Obwohl das Notfallhandbuch sich hauptsächlich auf Notfälle konzentriert, sollten auch generelle Richtlinien für die Reaktion auf Katastrophen bereitgestellt werden, unter Einbeziehung von Katastrophenschutz- und Rettungsplänen.

Das Notfallhandbuch muss sicherstellen, dass für jede dieser Kategorien spezifische, detaillierte und durchführbare Pläne entwickelt wurden. Diese Pläne sollten nicht nur die unmittelbare Reaktion auf den Vorfall umfassen, sondern auch langfristige Strategien zur Wiederherstellung und zum Schutz der Geschäftskontinuität. Dabei ist es wichtig, die Verantwortlichkeiten und Kommunikationswege klar zu definieren, um eine schnelle und koordinierte Reaktion zu ermöglichen.

Notbesetzung der Organisationseinheit

Die Gewährleistung der Geschäftskontinuität in Notfallsituationen ist eine kritische Verantwortung des Notfallmanagements. Bei Ausfall essenzieller Funktionen oder Ressourcen ist der Notfallmanager verpflichtet, schnell und effektiv zu handeln, um die Aufrechterhaltung der zeitkritischen Geschäftsprozesse zu sichern.

Grundlagen des Notbetriebs

  • Die Entscheidung über die Notbesetzung fällt in den Verantwortungsbereich des Notfallmanagers, der die betriebliche Kontinuität unter eingeschränkten Bedingungen sicherstellt.

  • Alternativstandorte und flexible Arbeitszeiten können etabliert werden, um die Mindestanforderungen der Geschäftstätigkeit zu erfüllen.

  • Für die Planung und Realisierung der Notbesetzung wird das sogenannte "Worst-Case-Szenario" angenommen, um auf die ungünstigsten Bedingungen vorbereitet zu sein.

Ermittlung der Notfallbesetzung

  • Eine sorgfältige Analyse bestimmt die minimale Anzahl an Mitarbeitenden, die benötigt wird, um die kritischsten Geschäftsabläufe fortzuführen.

  • Rollen und Verantwortlichkeiten werden klar definiert, um sicherzustellen, dass jede Person im Notfallteam genau weiß, was zu tun ist.

  • Arbeitsplätze und Ressourcen werden im Voraus festgelegt, um eine effiziente Reaktion auf den Notfall zu ermöglichen.

Kommunikation und Koordination

  • Der Notfallmanager etabliert Kommunikationspläne, um sicherzustellen, dass alle Mitarbeiter schnell und eindeutig über den Eintritt eines Notfalls informiert werden.

  • Es werden Abstimmungen mit angrenzenden Geschäftseinheiten vorgenommen, um eine übergreifende Koordination im Notbetrieb zu gewährleisten.

  • Ein regelmäßiges Reporting an das Krisenmanagement-Team ist erforderlich, um eine zentrale Übersicht über den Status der Notfallsituation zu behalten.

Zurück zum Normalbetrieb

  • Sobald die normale Betriebsfähigkeit wiederhergestellt werden kann, leitet der Notfallmanager die Schritte zur Rückkehr zum regulären Geschäftsbetrieb ein.

  • Die im Notbetrieb gewonnenen Erfahrungen und Daten werden analysiert, um den Prozess für zukünftige Ereignisse zu optimieren und zu verbessern.

Sicherstellung der Betriebskontinuität durch Rollen- und Funktionsplanung im Notbetrieb

Die Identifizierung der für den Notbetrieb wesentlichen Rollen und Funktionen beinhaltet die Analyse, welche Positionen zwingend besetzt sein müssen, um die kritischen Geschäftsprozesse aufrechtzuerhalten.

Grundlegende Anforderungen

  • Für jeden kritischen Prozess muss ein Verantwortlicher bestimmt werden, der im Notfall die jeweilige Rolle übernimmt.

  • Die Definition der Rollen beinhaltet auch die Zuweisung von Stellvertretern, die bei Bedarf einspringen können.

  • Zudem ist eine detaillierte Auflistung der erforderlichen Arbeitsplätze und deren technische Ausstattung notwendig, um die Ausführung der kritischen Prozesse zu garantieren.

Ermittlung des Bedarfs an Notfallarbeitsplätzen

  • Die Anzahl der benötigten Notfallarbeitsplätze muss im Vorfeld bestimmt und vorbereitet werden.

  • Sollten Arbeitsplätze an der Hauptlokation ausfallen, muss eine ausreichende Anzahl von Arbeitsplätzen an einer alternativen Lokation verfügbar sein.

  • Bei einem teilweisen oder vollständigen Ausfall des Standorts sollte die Möglichkeit bestehen, dass Mitarbeiter ihre Tätigkeiten remote, also von einem anderen Ort oder von zu Hause, ausführen können.

Remote-Arbeitsstrategien

  • Die technische Infrastruktur für Remote-Arbeitsplätze muss so eingerichtet sein, dass sie im Falle eines Notfalls schnell aktiviert werden kann.

  • Es ist wichtig, dass die Mitarbeiter im Umgang mit Remote-Arbeitsplatzlösungen geschult werden und regelmäßige Tests durchgeführt werden.

  • Bei der Auswahl der Remote-Arbeitsplatzlösungen sollten Sicherheitsaspekte und Datenschutzbeschränkungen berücksichtigt werden, um die Integrität und Vertraulichkeit von Daten zu wahren.

Planung und Training

  • Um die effektive Funktion des Notbetriebs zu gewährleisten, ist eine gründliche Planung und regelmäßiges Training der Mitarbeiter unerlässlich.

  • Sowohl die Verantwortlichen für die Rollen und Funktionen als auch die Mitarbeiter, die im Notbetrieb arbeiten, sollten in den Notfallplänen und in der Handhabung der Ausweicharbeitsplätze gut unterwiesen sein.

Ergänzende Rollen und Befugnisse im Krisenmanagement

Festlegung der Rollen und Verantwortlichkeiten

  • Alle Rollen innerhalb des Notfallteams müssen klar definiert sein, um sicherzustellen, dass im Notfall keine Verwirrung hinsichtlich der Zuständigkeiten entsteht.

  • Jede Rolle sollte eine klare Beschreibung ihrer Aufgaben und Verantwortungsbereiche haben, sowie der besonderen Befugnisse, die im Notfall gültig sind.

Erweiterung der Befugnisse

  • Bestimmte Rollen können im Falle eines Notfalls erweiterte Befugnisse erhalten, um schnellere Entscheidungen treffen zu können.

  • Dies kann die Genehmigung von Ausgaben, die Freigabe von Ressourcen oder die Änderung von Betriebsabläufen umfassen, um nur einige Beispiele zu nennen.

Kommunikation und Dokumentation

  • Die besonderen Befugnisse im Notfall müssen allen Beteiligten klar kommuniziert werden.

  • Zusätzliche Kompetenzen und die damit verbundenen Entscheidungen müssen dokumentiert werden, um Transparenz und Nachvollziehbarkeit zu gewährleisten.0

Gesetzliche Rahmenbedingungen

  • Alle erweiterten Befugnisse müssen im Einklang mit geltenden Gesetzen und internen Richtlinien stehen.

  • Insbesondere muss die Funktionstrennung beachtet werden, um Interessenkonflikte und Compliance-Verstöße zu vermeiden.

Beispielhafte Rollen im Notfallteam

  • Notfallmanager
    Koordination des Krisenteams und Übernahme der Leitung im Notfall.

  • IT-Sicherheitsbeauftragter
    Gewährleistung der IT-Sicherheit und schnelle Behebung von IT-Problemen.

  • Kommunikationsverantwortlicher
    Steuerung der internen und externen Kommunikation.

  • Logistikkoordinator
    Sicherstellung der Ressourcenverteilung und Infrastrukturmanagement.

Alarmierung und Kommunikation im Notfall

Im Notfall dient der Notfallmanager Risk als zentraler Anlaufpunkt für alle Mitarbeitenden seines Bereichs und fungiert als primäre Informationsquelle. Im Falle eines Notfalls hat er die Aufgabe, alle relevanten Mitarbeitenden der Organisationseinheit, einschließlich jener an dezentralen Standorten, über die internen Kommunikationswege oder, falls notwendig, über private Kontaktadressen zu alarmieren

Der Notfallmanager Risk koordiniert zudem mit angrenzenden Abteilungen, um sicherzustellen, dass alle notwendigen Schritte im Einklang mit den übergeordneten Strategien und Prozessen stehen. Er sorgt für die Abstimmung mit dem Finanzbereich hinsichtlich der Anforderungen an die Eigenmittel und teilt den Eintritt in den Notbetrieb mit.

Strategien und Maßnahmen im Notfall

Szenario „Ausfall von Personal“

Strategien

  • Stellvertreterregelungen
    Für jede kritische Position sollten im Voraus Stellvertreter bestimmt werden, die in der Lage sind, die wesentlichen Aufgaben zu übernehmen. Dies beinhaltet eine entsprechende Einarbeitung und regelmäßiges Training.

  • Flexibles Personalmanagement
    Ein Pool von Mitarbeitern, die verschiedene Rollen übernehmen können, schafft Flexibilität und verringert die Abhängigkeit von Einzelpersonen.

  • Externes Personal
    Im Falle eines drastischen Personalausfalls kann die kurzfristige Akquise von qualifiziertem Personal über Zeitarbeitsfirmen oder Dienstleister eine Lösung sein.

Maßnahmen im Notfall

  • Sofortige Identifizierung der betroffenen Rollen
    Feststellen, welche Schlüsselpositionen unbesetzt sind und wie kritisch diese für den Betriebsablauf sind.

  • Aktivierung des Stellvertreterplans
    Unmittelbares Hochfahren des Stellvertretersystems, um sicherzustellen, dass die kritischen Funktionen weiterhin besetzt sind.

  • Kommunikation und Koordination
    Informieren aller relevanten Stakeholder über den Notfall und die ergriffenen Maßnahmen, um Transparenz zu gewährleisten und zusätzliche Unterstützung zu organisieren.

  • Anpassung der Arbeitslast
    Priorisierung und ggf. Verschiebung von weniger kritischen Aufgaben, um die verfügbaren Ressourcen auf die wesentlichen Funktionen zu konzentrieren.

  • Überprüfung und Anpassung von Arbeitsabläufen
    Anpassung der Prozesse, um den veränderten Personalbestand widerzuspiegeln, ohne die Qualität der Arbeit zu beeinträchtigen.

Maßnahmen zur Rückkehr in den Normalbetrieb

  • Reintegration des Personals
    Wenn das reguläre Personal wieder verfügbar ist, sollte eine geordnete Rückkehr zu den normalen Abläufen erfolgen.

  • Nachbereitung und Analyse
    Nach dem Notfall sollte eine Analyse durchgeführt werden, um zu bewerten, was gut funktioniert hat und wo Verbesserungen möglich sind.

  • Dokumentation und Feedback
    Die Erfahrungen aus dem Notfall sollten dokumentiert und genutzt werden, um den BCP zu verbessern und das Personal für zukünftige Vorfälle besser vorzubereiten.

Szenario „Ausfall Gebäude und Gebäudeinfrastrukturen“

Strategien

  • Ausweichstandorte
    Vorbereitete Ausweichstandorte, die schnell aktiviert werden können, sind essenziell. Diese Standorte sollten über notwendige Arbeitsmittel und Zugang zu kritischen IT-Systemen verfügen.

  • Remote-Arbeitsmöglichkeiten
    Flexible Arbeitsregelungen wie Homeoffice oder remote zugängliche Arbeitsplätze für Mitarbeiter, um die Arbeit auch bei Gebäudeausfall fortsetzen zu können.

  • Kritische Infrastrukturen sichern
    Nutzung von unterbrechungsfreien Stromversorgungen (USVs) und Generatoren für kritische Systeme sowie Sicherstellung alternativer Kommunikationswege.

Maßnahmen im Notfall

  • Evakuierungspläne
    Im Falle einer Notsituation sollten klare Evakuierungspläne vorhanden sein, um die Sicherheit des Personals zu gewährleisten.

  • Aktivierung von Notfallteams
    Einsatz von Notfallteams, die darauf trainiert sind, schnell zu handeln und den Betrieb an alternativen Standorten aufzunehmen.

  • Notfallkommunikation
    Sicherstellen einer zuverlässigen Informationsweitergabe an Mitarbeiter, Kunden und Partner über den Status des Notfalls und die nächsten Schritte.

Maßnahmen zur Rückkehr in den Normalbetrieb

  • Überprüfung und Freigabe des Gebäudes
    Bevor der Betrieb wieder aufgenommen wird, muss das Gebäude auf Sicherheit geprüft und freigegeben werden.

  • Restaurierung der Infrastruktur
    Reparatur und Wiederherstellung aller betroffenen Gebäudeteile und Infrastrukturen, bevor die Mitarbeiter zurückkehren.

  • Nachbereitung
    Analyse des Notfallmanagements und Bewertung der Ausweichstrategien, um künftige Abläufe zu verbessern.

  • Wiederaufnahme des Betriebs
    Schrittweise Rückkehr zum normalen Betrieb unter Berücksichtigung aller Sicherheits- und Gesundheitsaspekte.

Szenario „Ausfall von IT-Anwendungen und IT-Services“

Strategien

  • Disaster Recovery Plan
    Entwicklung und regelmäßige Aktualisierung eines Disaster Recovery Plans, der Schritte für die Wiederherstellung von IT-Services und Anwendungen im Notfall beinhaltet.
  • Redundante Systeme
    Implementierung redundanter Systeme und Datenbanken, die bei Ausfall der primären IT-Infrastruktur aktiviert werden können.

  • Cloud-Dienste
    Nutzung von Cloud-basierten Services für kritische Anwendungen, um von deren integrierter Hochverfügbarkeit und geografischer Redundanz zu profitieren.

Maßnahmen im Notfall

  • Aktivierung des Disaster Recovery Plans
    Sofortige Aktivierung des vorab erstellten Disaster Recovery Plans, um die IT-Services und Anwendungen wiederherzustellen.

  • Schalten auf Ersatzsysteme
    Umschalten auf vorbereitete Ersatzsysteme, um die Kerngeschäftsprozesse aufrechtzuerhalten.

  • Notkommunikation
    Einrichtung einer Notkommunikation, um Mitarbeitenden und Kunden den Ausfall und die erwartete Wiederherstellungszeit mitzuteilen.

Maßnahmen zur Rückführung in den Normalbetrieb

  • Schrittweise Wiederherstellung
    Schrittweise Wiederherstellung und Integration der IT-Services und Anwendungen, um Stabilität und Funktionalität zu gewährleisten.

  • Überprüfung der Datenintegrität
    Sicherstellung, dass alle wiederhergestellten Daten und Anwendungen vor der vollständigen Inbetriebnahme auf Integrität und Vollständigkeit überprüft werden.

  • Nachbereitung und Analyse
    Nach dem Notfall eine gründliche Untersuchung durchführen, um die Ursachen zu verstehen und die Strategien und Maßnahmen für zukünftige Ausfallsicherheit zu verbessern.

Szenario „Ausfall von Dienstleistungen“

Strategien

  • Mehrere Dienstleister
    Zusammenarbeit mit mehreren Dienstleistern für kritische Services, um das Risiko einer kompletten Unterbrechung zu minimieren.

  • Interne Redundanzen schaffen
    Aufbau interner Kapazitäten, um Dienstleistungen notfalls selbst erbringen zu können, falls externe Anbieter ausfallen.

  • Dienstleister-Audits
    Regelmäßige Überprüfung der Dienstleister hinsichtlich ihrer Notfall- und Wiederherstellungspläne, um die Zuverlässigkeit im Notfall sicherzustellen.

Maßnahmen im Notfall

  • Aktivierung alternativer Lieferanten:
    Vorab vereinbarte Verträge mit alternativen Lieferanten, die im Notfall aktiviert werden können, um die Dienstleistung fortzuführen.

  • Notfallkommunikation
    Schnelle Kommunikation mit dem Dienstleister, um das Ausmaß des Ausfalls zu verstehen und zusammen an einer Lösung zu arbeiten.

  • Eigeninitiative ergreifen
    Wenn möglich, temporäre interne Maßnahmen ergreifen, um die kritischen Dienstleistungen selbst bereitzustellen.

Maßnahmen zur Rückführung in den Normalbetrieb

  • Koordinierte Wiederherstellung
    Zusammenarbeit mit dem Dienstleister, um die Wiederherstellung der Dienstleistungen zu planen und umzusetzen.

  • Prüfung der Servicequalität
    Bevor die normalen Betriebsabläufe wieder aufgenommen werden, muss sichergestellt werden, dass die Dienstleistungen den erforderlichen Qualitätsstandards entsprechen.

  • Evaluation und Anpassung
    Überprüfung der Notfallmaßnahmen und Anpassung der Strategien für Dienstleistungen, um zukünftige Ausfälle zu verhindern.

Wiederanlaufanforderungen

Die Wiederanlaufanforderungen sind entscheidend für die Planung und Umsetzung von Maßnahmen zur Wiederherstellung von Geschäftsprozessen und IT-Systemen nach einem Notfall. Sie definieren die maximal tolerierbaren Ausfallzeiten und Datenverluste, um den Fortbestand des Unternehmens zu sichern.

Definition der Wiederanlaufklassen für Geschäftsfunktionen und IT-Anwendungen

Eine derartige Tabelle sollte im Notfallhandbuch enthalten sein, um sicherzustellen, dass alle Beteiligten wissen, wen sie in verschiedenen Notfallsituationen kontaktieren müssen.

Wiederanlaufanforderungen setzen sich aus zwei Hauptkomponenten zusammen: der Wiederherstellungszeit (Recovery Time Objective, RTO) und der Datenverlustzeit (Recovery Point Objective, RPO).

Wiederherstellungszeit (RTO):

  • Für Geschäftsfunktionen: Die Zeitspanne zwischen dem Eintritt des Notfalls und der Wiederverfügbarkeit der ersten Arbeitsplätze sowie der benötigten Arbeitsressourcen, was den Beginn des Notbetriebs markiert.

  • Für IT-Anwendungen: Die Zeitspanne zwischen dem Eintritt des Notfalls und der Wiederverfügbarkeit der Anwendung für Benutzer oder für die Kommunikation mit anderen Anwendungen.

Datenverlustzeit (RPO):

  • Für Geschäftsfunktionen: Nicht anwendbar, da sich der RPO in der Regel auf Daten und IT-Systeme bezieht.

  • Für IT-Anwendungen: Die Zeitspanne zwischen der letzten Datensicherung und dem Eintritt des Notfalls. Alle in diesem Zeitraum vorgenommenen Benutzereingaben oder Datenänderungen sind unwiederbringlich verloren.

Wiederanlaufklassen

Zur effektiven Planung und Priorisierung von Wiederanlaufmaßnahmen ist die Einteilung in Wiederanlaufklassen hilfreich. Diese Klassen basieren auf den festgelegten RTOs und RPOs und berücksichtigen die technischen und organisatorischen Möglichkeiten zur Wiederherstellung. Die Klassifizierung hilft dabei, die kritischsten Geschäftsfunktionen und IT-Anwendungen zu identifizieren und entsprechende Vorsorge- und Wiederanlaufpläne zu entwickeln.

Beispielhafte Wiederanlaufklassen könnten sein:

  • Klasse 1
    Höchste Priorität mit RTOs von wenigen Minuten bis Stunden und minimalen RPOs, um kritische Geschäftsprozesse und IT-Systeme zu schützen.

  • Klasse 2
    Mittlere Priorität mit längeren RTOs und akzeptablen RPOs für wichtige, jedoch nicht kritische Funktionen.

  • Klasse 3
    Niedrige Priorität für Prozesse und Systeme, deren Ausfall oder Datenverlust für längere Zeit tolerierbar ist.

Die Festlegung dieser Klassen ermöglicht es Unternehmen, Ressourcen gezielt zuzuweisen und Notfall- sowie Wiederanlaufpläne entsprechend der kritischen Bedeutung von Geschäftsprozessen und IT-Systemen zu priorisieren.

Die Kosten für die Einrichtung und den Unterhalt von Wiederanlauflösungen sind umso höher, je kürzer die geforderte Wiederherstellungs- und Datenverlustzeit ist. Nach einem Notfall entstehende Kosten für den Wiederanlauf können durch eine Mehrkostenversicherung gedeckt werden.

Bei der Einstufung von Anwendungen und Geschäftsfunktionen in diese Klassen sind mehrere Bewertungskriterien zu berücksichtigen:

  • Verletzung gesetzlicher oder anderweitiger Vorgaben.
  • Der Punkt, ab dem erhebliche materielle oder immaterielle Schäden für das Unternehmen entstehen.
  • Die Verfügbarkeit von Übergangs- und Ausweichverfahren, um Ausfälle zu kompensieren.
  • Die Notwendigkeit, nicht getätigte Dateneingaben nachzuarbeiten und der mögliche Zeitraum hierfür.
  • Die maximal tolerierbare Dauer des Datenverlusts.

Zuordnung der Geschäftsfunktionen zu Wiederanlaufklassen

Die Zuordnung von Geschäftsfunktionen zu den entsprechenden Wiederanlaufklassen ist ein kritischer Schritt, um die Prioritäten für die Wiederherstellungsstrategien festzulegen. Die Zuordnung basiert auf der Wichtigkeit jeder Geschäftsfunktion und den Auswirkungen, die ein Ausfall auf das Gesamtunternehmen hätte. Hierbei wird jede Geschäftsfunktion nach verschiedenen Kriterien bewertet und entsprechend einer Wiederanlaufklasse zugewiesen.

Zuordnung der IT-Anwendungen zu den Wiederanlaufklassen

Die Zuordnung von IT-Anwendungen zu den Wiederanlaufklassen basiert auf der Bedeutung der Anwendungen für den Geschäftsbetrieb sowie auf der Datenkritikalität und dem Ausfallrisiko. Bei backup-relevanten IT-Anwendungen ist die Fähigkeit zur Datenwiederherstellung nach einem Notfall ein Schlüsselfaktor.

Schadensbewertung

Die Schadensbewertung ist ein wesentlicher Bestandteil des Risikomanagements und der Notfallplanung, besonders im Hinblick auf IT-Abhängigkeiten in modernen Unternehmen. Sie ermöglicht es, die Investitionen in Wiederanlaufstrategien und -lösungen zu rechtfertigen, indem sie das Schadenspotenzial quantifiziert und qualifiziert. Dies ist entscheidend, um sicherzustellen, dass die Vorsorgekosten in einem angemessenen Verhältnis zum potenziellen Schaden stehen.

Die Schwierigkeit, Schadensfolgen ausschließlich monetär zu bewerten, führt zur Einbeziehung von qualitativen Faktoren. Die vier Kategorien der Schadensbewertung – unternehmenskritisch, erheblich, spürbar, unbedeutend – helfen dabei, die potenziellen Auswirkungen eines Notfalls auf verschiedene Aspekte des Unternehmens zu erfassen:

  • Unternehmenskritisch
    Bedroht die Existenz des Unternehmens, wobei neben finanziellen auch strategische und existenzielle Faktoren eine Rolle spielen.

  • Erheblich
    Beeinträchtigt wichtige Bestandteile der Wertschöpfungskette. Dies führt zu einem sichtbaren Einfluss auf finanzielle Kennzahlen und kann Kunden- und Auftragsverluste nach sich ziehen.

  • Spürbar
    Hat Einfluss auf das Kerngeschäft, aber die Auswirkungen können durch zusätzlichen organisatorischen Aufwand und außerplanmäßige Maßnahmen begrenzt werden, ohne dass Außenstehende deutliche Auswirkungen spüren.

  • Unbedeutend
    Stört die Geschäftsabläufe minimal und hat keine Außenwirkungen. Der entstehende Mehraufwand kann innerhalb der regulären Arbeitszeiten bewältigt werden.

Für die Schadensbewertung ist auch zu beachten, dass Sachschäden in der Regel versichert sind und daher oft weniger Gewicht bei der Bewertung des Schadenspotenzials haben.

Eine Beratung, so wie sie sein soll – Hettwer UnternehmensBeratung GmbH – Eine Beratung, so wie sie sein soll – Hettwer UnternehmensBeratung GmbH – Eine Beratung, so wie sie sein soll – Hettwer UnternehmensBeratung GmbH – Eine Beratung, so wie sie sein soll – Hettwer UnternehmensBeratung GmbH – Eine Beratung, so wie sie sein soll – Hettwer UnternehmensBeratung GmbH

Hettwer UnternehmensBeratung

Hettwer UnternehmensBeratung GmbH - Spezialisierte Beratung - Umsetzungsdienstleistungen im Finanzdienstleistungssektor – Experte im Projekt- und Interimsauftragsgeschäft - www.hettwer-beratung.de

H-UB ERFOLGSGESCHICHTE

Auszeichnung:

Gold-Partner-Zertifikat

Hettwer UnternehmensBeratung GmbH wurde aufgrund der erbrachten Beraterleistungen in den exklusiven Kreis der etengo Gold-Partner aufgenommen.

H-UB EXPERTENWISSEN

Hettwer UnternehmensBeratung GmbH – Expertenprofil Klaus Georg Hettwer (Geschäftsführer): Beratungskompetenz, Fachliche Kompetenz, Methodische Kompetenz, Soziale Kompetenz, Kommunikationskompetenz; Sonderthemen: SEPA, EMIR, TARGET2, MiFID, T2S

- Eine Beratung mit PROFIL -

H-UB Leistungskatalog

H-UB Leistungskatalog.pdf
Adobe Acrobat Dokument 89.4 KB

H-UB SOCIAL MEDIA PRÄSENZ

© 2010-2024 Hettwer UnternehmensBeratung GmbH