はじめに
英国のスタートアップ企業であるPineapple Technology Ltd様が運営するincident.ioに関連したブログ The Practical Guide to Incident Management のポイントと解説
ポイント!!
- 重大度レベルは社内外にインシデントの影響を伝え、インシデントの深刻具合を明確にし、障害対応のスムーズな優先順位付けを促進します。
- 組織全体で重大度レベルを共有することが重要であり、明確なルール・定義が必要です。
- 具体的には、3~5レベルにして、松竹梅の法則を利用、High,Lowのようなそのまま意味わかる言葉を、重大度レベルは対応後に正確に直すべき。
参考:Severities
解説
よく記載がある「重大度」についてです。ここはあまり目新しいことは無かったのですが、イギリスでも同じような発想なので、インシデントの定義は世界共通で悩まれているというのが発見でした。
示唆があった点であれば、重大度レベルは「スタートアップは3個ぐらい、成長したら5個ぐらいがいい」と「インシデントクローズ後に重大度を正確に直すこと」かなと思います。
前者はたしかに個数を明確にうたっている記事は見たことなかったので参考にできます。後者の記載始めてみました。システム障害対応時に重大度を決めて、そのままにしておくことが多かったのですが、たしかにクローズ後に「本当にその重大度でよかったか?」を検討することは、正しい重大度を早く決定するための学びがありそうです。
用語
- 重大度レベル:インシデントの深刻度合を示す尺度で、インシデント管理において重要な役割を果たす。
- 優先順位付け:インシデントやタスクに関して、重要度に基づいて順序をつけること。
執筆責任者
野村浩司
野村浩司
「3カ月で改善!システム障害対応 実践ガイド」著者
野村浩司:金融システムの開発保守運用と改善を12年担当。7年にわたり合計約 1000 件の障害事例を分析。システム障害対応の改善では、アラートを9割削減。
野村浩司:金融システムの開発保守運用と改善を12年担当。7年にわたり合計約 1000 件の障害事例を分析。システム障害対応の改善では、アラートを9割削減。