Sequentielle Eskalationsstufen
Fügen Sie so viele Stufen hinzu, wie Ihr Team benötigt. Jede Stufe hat ihre eigenen Ziele und ihr eigenes Timeout-Fenster. Die Richtlinie schreitet automatisch voran, wenn keine Bestätigung rechtzeitig eingeht.
Definieren Sie schrittweise Richtlinien, die Person A benachrichtigen, warten, dann Person B benachrichtigen, dann das ganze Team — bis jemand bestätigt. Pro-Service- Richtlinien, Multi-Channel, mit konfigurierbaren Timeouts auf jeder Stufe.
Kritische Alerts hören nicht nach einem Versuch auf. Eine Eskalationsrichtlinie arbeitet ihre Stufen methodisch durch — benachrichtigt jedes Ziel, wartet auf einen konfigurierbaren Timeout, dann geht sie weiter — bis der Incident bestätigt wird oder die Richtlinie sich wiederholt.
Fügen Sie so viele Stufen hinzu, wie Ihr Team benötigt. Jede Stufe hat ihre eigenen Ziele und ihr eigenes Timeout-Fenster. Die Richtlinie schreitet automatisch voran, wenn keine Bestätigung rechtzeitig eingeht.
Legen Sie das Bestätigungsfenster unabhängig für jede Stufe fest — 5 Minuten für den Bereitschaftsingenieur, dann 10 Minuten für den Teamleiter, dann sofortiger Page an das gesamte Team.
Richten Sie jede Stufe auf eine bestimmte Person oder auf einen Rufbereitschafts-Zeitplan. Wenn ein Zeitplan anvisiert wird, wird der aktuelle Bereitschaftsresponder für diesen Zeitplan paginiert — wer auch immer das gerade ist.
Konfigurieren Sie einen Wiederholungszähler, damit die gesamte Richtlinie neu startet, wenn alle Stufen ohne Bestätigung erschöpft sind. Kritische Alerts laufen weiter, bis jemand antwortet.
Jeder Service in Ihrem Katalog trägt seine eigene Eskalationsrichtlinie. Payments-Alerts werden an die Payments-Rufbereitschaft weitergeleitet; Platform-Alerts an das Platform-Team. Kein manuelles Routing.
Sehen Sie in Echtzeit im Incident-Datensatz, auf welcher Stufe sich eine aktive Eskalation befindet — welche Stufe ausgelöst wurde, wer benachrichtigt wurde, wer bestätigt hat und wie lange jeder Schritt dauerte.
Die meisten Alerting-Tools senden eine einzige Benachrichtigung und betrachten das als erledigt. Eskalationsrichtlinien sind anders: Sie schreiten automatisch durch die Stufen vor, berücksichtigen Stille, bis der Incident bestätigt wird — oder bis das konfigurierte Wiederholungslimit erreicht ist.
Weisen Sie jedem Service in Ihrem Katalog eine andere Eskalationsrichtlinie zu und provisionieren Sie sie alle über die REST API. Fügen Sie die Aufrufe in ein Skript in Ihrem Repo ein und Pull Requests zeigen Ihnen genau, welche Services ihr Routing geändert haben — keine Überraschungen während eines Incidents.
Stufen pro Richtlinie — so viele wie Ihr Team benötigt
verlorene Alerts — Richtlinie wiederholt sich bis zur Bestätigung
minimaler konfigurierbarer Timeout zwischen Eskalationsstufen
kostenloser Tarif — Eskalationsrichtlinien von Anfang an inklusive
Es gibt kein festes Limit für die Anzahl der Stufen. In der Praxis verwenden die meisten Teams zwei bis vier Stufen — Bereitschaftsingenieur, Teamleiter, dann das gesamte Team — aber Sie können so viele hinzufügen, wie Ihre betrieblichen Anforderungen verlangen.
Wenn eine Richtlinie mit einem Wiederholungszähler größer als null konfiguriert ist, startet sie von Stufe eins neu und arbeitet die Stufen erneut durch. Dies setzt sich fort, bis das Wiederholungslimit erreicht ist oder jemand den Incident bestätigt.
Ja — und das ist der empfohlene Ansatz. Richten Sie eine Stufe auf einen Rufbereitschafts-Zeitplan aus und Site Qwality bestimmt, wer bei Auslösung der Stufe gerade im Dienst ist. Sie müssen die Richtlinie nie aktualisieren, wenn sich Rotationen ändern.
Eskalation respektiert die persönlichen Benachrichtigungsregeln jedes Teammitglieds. Wenn ein Responder SMS für dringende Alerts und Slack für niedrig priorisierte konfiguriert hat, wird diese Präferenz berücksichtigt, wenn die Eskalationsrichtlinie ihn paginiert.
Ja — das ist der Sinn und Zweck. Jedem Service in Ihrem Katalog wird seine eigene Eskalationsrichtlinie zugewiesen. Payments kann eine strenge SLA-Richtlinie haben; ein internes Tool kann eine entspannte haben. Änderungen sind pro Service und treten sofort in Kraft.
Jedes Produkt startet kostenlos — Uptime-Monitoring, Cron-Monitoring, Synthetisches Monitoring, Logs, RUM, Incidents und Statusseiten. Keine Kreditkarte erforderlich.