多機能なDatadogでアプリケーション・インフラストラクチャの監視を改善
レビュー投稿日の情報になります
株式会社SODA / decoch
EM / EM / 従業員規模: 301名〜500名 / エンジニア組織: 11名〜50名
最終更新日投稿日
ツールの利用規模 | ツールの利用開始時期 |
---|---|
51名〜100名 | 2021年6月 |
ツールの利用規模 | 51名〜100名 |
---|---|
ツールの利用開始時期 | 2021年6月 |
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
TV CM を実施する際に耐障害性を高める施策を実施していたところ、従来利用していた監視ツールでは監視機能が不十分という課題が浮かび、監視ツールの再考を行いました。
どのような状態を目指していたか
- 障害対応などの効率化、また発生した障害に気づきやすくする
- サーバの健康状態を把握しやすくする
- パフォーマンス計測やログ調査の人的コストを下げる
比較検討したサービス
- Amazon CloudWatch
比較した軸
- ログやメトリクスの見やすさ
- 検索の使い勝手
選定理由
- かなり広く使われており、情報が多かったこと
- 前職以前から使っており、導入による効果がイメージできていたこと
導入の成果
改善したかった課題はどれくらい解決されたか
監視機能の改善はすぐに達成できました。
どのような成果が得られたか
障害対応や、オンコールの対応、シンセティクステストなど課題が出るたびに Datadog の機能を利用し解決できています。
導入時の苦労・悩み
Datadog Agent がうまく動いていないなどの問題がありました。
導入に向けた社内への説明
上長・チームへの説明
CTO も過去に Datadog 利用していたので細かい説明は不要でした。
活用方法
- 障害対応
- Aurora や、ロードバランサーなどのエラー率、CPU使用率で事前に障害を防げたり、障害の原因の調査に利用している
- インシデント対応
- ログ、メトリクスを PagerDuty と連携したインシデント対応に利用している
- 外形監視
- メトリクスのモニタリング以外の機能でもサービスの品質を改善する基盤が整った
よく使う機能
- SLO
- Synthetic Monitoring & Testing
- RUM
- Dashboards
- CI Visibility
ツールの良い点
- 機能が充実しており導入後に見つかった課題の解決にも使えている
- 広く使われているので、インターネット上に情報が多い
ツールの課題点
- 監視対象を増やしすぎるとコストが増加してしまう
- いろんな機能がありすぎてキャッチアップが大変
ツールを検討されている方へ
アプリケーション・インフラストラクチャの監視ができ、多機能でさまざまな機能を利用させてもらっています。機能は多いですがキャッチアップすればさまざまな課題解決に役立つと思います。
株式会社SODA / decoch
EM / EM / 従業員規模: 301名〜500名 / エンジニア組織: 11名〜50名
新卒でビズリーチに入社し、2019年にスタートアップのBrhinoに転職。フリーランスを経て現職のSODAに入社。現在はエンジニアリングマネージャーとして採用や組織づくりに携わっています。
よく見られているレビュー
株式会社SODA / decoch
EM / EM / 従業員規模: 301名〜500名 / エンジニア組織: 11名〜50名
新卒でビズリーチに入社し、2019年にス...
もっとみる