品質ダッシュボード
サービス信頼性メトリクス
Sprint #12 Active
MTTR(平均修理時間)
0.5h
↓ -15% 改善
目標: 1h以内達成
MTBF(平均故障間隔)
168h
↑ +23% 改善
目標: 120h以上達成
稼働率
99.95%
→ 安定
SLA: 99.9%達成
エラー数(直近30日)
23件
↓ -8件 前月比
前月: 31件
稼働率推移(直近30日・日別)
3/13/73/143/213/30
直近のエラー一覧
| 発生日時 | エラー種別 | 重要度 | 影響範囲 | 内容 | 修理時間 | ステータス | 担当 |
|---|---|---|---|---|---|---|---|
| 3/7 15:23 | サーバーエラー | Critical | 全ユーザー | API認証サービスのタイムアウト | 0.3h | 解決済 | 鈴木 |
| 3/5 09:45 | パフォーマンス | High | 一部ユーザー | ダッシュボード読み込み遅延(>5秒) | 1.2h | 解決済 | 田中 |
| 3/5 08:12 | サーバーエラー | Critical | 全ユーザー | DBコネクションプール枯渇 | 0.5h | 解決済 | 鈴木 |
| 3/3 22:30 | 機能エラー | Medium | 特定機能 | レポートCSVエクスポートの文字化け | 0.8h | 解決済 | 高橋 |
| 3/1 14:00 | サーバーエラー | Critical | 全ユーザー | デプロイ後のメモリリーク | 0.4h | 解決済 | 鈴木 |
| 3/1 10:15 | 機能エラー | Low | 特定機能 | 通知設定の保存失敗(特定ブラウザ) | 2.0h | 解決済 | 佐藤 |
| 2/27 16:40 | パフォーマンス | Medium | 一部ユーザー | 検索APIの応答遅延(>3秒) | 1.5h | 解決済 | 田中 |
| 2/25 11:20 | サーバーエラー | High | 全ユーザー | CDN障害によるアセット配信停止 | 0.2h | 解決済 | 鈴木 |
| 2/23 09:00 | 機能エラー | Medium | 特定機能 | ファイルアップロード上限超過時のエラー表示 | 1.0h | 解決済 | 佐藤 |
| 2/20 13:45 | セキュリティ | High | 全ユーザー | レート制限の設定誤りによるAPI過負荷 | 0.3h | 解決済 | 田中 |
MTTR分析(エラー種別平均)
サーバーエラー0.35h
パフォーマンス1.35h
機能エラー1.27h
セキュリティ0.30h
MTBF推移(直近6スプリント)
目標 120h
96h
#7
120h
#8
132h
#9
144h
#10
156h
#11
168h
#12
週次インシデントレポートGASソースを開く
インシデントレポート
週次レポート一覧
2026年3月9日 週
API認証サービスのタイムアウト、CDN障害を含む3件のインシデントが発生。MTTR 0.33h。
作成: 2026/03/09 09:00
2026年3月2日 週
DBコネクションプール枯渇、デプロイ後メモリリークの2件。全サービス復旧済み。
作成: 2026/03/02 09:00
2026年2月23日 週
検索API応答遅延、ファイルアップロードエラー表示の2件。影響は限定的。
作成: 2026/02/23 09:00
2026年2月16日 週
レート制限設定誤りによるAPI過負荷。即時対応により影響最小限。
作成: 2026/02/16 09:00
2026年2月9日 週
インシデント0件。安定稼働週。
作成: 2026/02/09 09:00
週次インシデントレポート
2026年3月3日 〜 3月9日
発生件数
3
Critical
1
平均MTTR
0.33h
解決率
100%
インシデント詳細
CriticalAPI認証サービスのタイムアウト3/7 15:23
原因: 認証サービスの接続プール設定がデプロイ後にリセットされ、タイムアウトが既定値(30s→5s)に戻った。
影響: 全ユーザーのログイン・API呼び出しが約18分間断続的に失敗。
対応: 接続プールの設定を修正し、設定値の永続化をデプロイスクリプトに追加。
影響: 全ユーザーのログイン・API呼び出しが約18分間断続的に失敗。
対応: 接続プールの設定を修正し、設定値の永続化をデプロイスクリプトに追加。
修理時間: 0.3h担当: 鈴木解決済
Highダッシュボード読み込み遅延3/5 09:45
原因: 集計バッチ処理のロック競合により、ダッシュボードAPIのレスポンスが5秒超に悪化。
影響: ダッシュボードの表示が一部ユーザーで遅延(約200名に影響)。
対応: バッチ処理のスケジュールをピーク時間外に移動。クエリにインデックスを追加。
影響: ダッシュボードの表示が一部ユーザーで遅延(約200名に影響)。
対応: バッチ処理のスケジュールをピーク時間外に移動。クエリにインデックスを追加。
修理時間: 1.2h担当: 田中解決済
HighCDN障害によるアセット配信停止3/4 11:20
原因: CDNプロバイダ側の障害により、静的アセット(CSS/JS/画像)の配信が停止。
影響: 全ユーザーのUI表示が崩れ、一部機能が利用不可に。
対応: フォールバックオリジンサーバーへの切り替えを実施。CDNプロバイダへ障害報告。
影響: 全ユーザーのUI表示が崩れ、一部機能が利用不可に。
対応: フォールバックオリジンサーバーへの切り替えを実施。CDNプロバイダへ障害報告。
修理時間: 0.2h担当: 鈴木解決済
再発防止策
1
デプロイ後の設定値検証を自動化
担当: 鈴木 / 期限: 3/14
2
CDNフォールバック自動切替の仕組みを構築
担当: 田中 / 期限: 3/21
3
バッチ処理スケジュールの見直しとモニタリング追加
担当: 田中 / 期限: 3/14