株式会社GaudiyのDatadog 導入事例

株式会社Gaudiy / AndooBomber
バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
利用プラン | 利用機能 | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|---|
Pro | APM, Logs, Network, Infrastructure, etc... | 11名〜50名 | 2023年9月 | B to B B to C |
利用プラン | Pro |
---|---|
利用機能 | APM, Logs, Network, Infrastructure, etc... |
ツールの利用規模 | 11名〜50名 |
ツールの利用開始時期 | 2023年9月 |
事業形態 | B to B B to C |
アーキテクチャ
アーキテクチャの意図・工夫
OpenTelemetry を活用しており、Kubernetes 上の全てのマイクロサービスが OpenTelemetry Collector を経由してテレメトリーデータを Datadog に送信しています。 Datadog Logs の保持期間を過ぎたデータは Cloud Storage にバックアップしており、BigQuery で検索しています。また、一部のデータは fluentd 経由で Cloud Storage に保存しています。
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
GCP(Cloud Logging, Trace, Metrics) を利用してシステム監視していましたが、求める基本機能は満たしていたものの直観的な UI/UX で無かったり、ダッシュボードやアラートのカスタマイズ性が欲しかったりと運用面で課題を抱えていました。
どのような状態を目指していたか
各チームが各々で DevOps のサイクルが回せるようにしたい。それが一番の目標でした。 その為には、チームの要望を満たす柔軟性が必要であったり、抵抗なく触れる直観的なUIが必要でした。
比較検討したサービス
- New Relic
- GCP
- Grafana
比較した軸
- 直観的に触れるかどうか(体験として良いか)
- 欲しい機能を満たしているか
選定理由
- トライアル期間で感触を確かめられたこと
- 利用経験のあるメンバーからの推し
導入の成果
改善したかった課題はどれくらい解決されたか
- Logs,Metrics,APM どれをとっても使いやすく、システム監視がし易くなった
- Dashboard を用意することにより、システムの可観測性が上がった
どのような成果が得られたか
- 各チームが APM を使ってパフォーマンス改善を行ったり、Dashboard を作ってシステム状況を確認したりと、チームが独立して能動的に Ops に注力することができた
導入時の苦労・悩み
OpenTelemetry を導入していたので、GCP からの切り替えはかなり楽にできました。 ただ、2つ苦労した点もありました。
- Datadog 独自の機能(Error Tracking等)に対応するためにアプリケーションコードに実装が必要だった
- Custom Metrics を増やしたら試算コストよりも大幅に費用がかかってしまった
導入に向けた社内への説明
上長・チームへの説明
社内の文化として、「高速実験」という素早く試して素早く失敗する文化があるので、トライアル期間を活用してすぐに導入しました。その上で上長やチームに触ってもらい、導入する価値があるかどうかを話し合いました。
活用方法
よく使う機能
- Dashboard
- 機能リリース時の監視や、チーム or サービス毎のシステム状況が一目でわかるような状態にしています。
- APM, Logs
- エラー時の原因調査やパフォーマンス改善などに使っています。
- Monitors
- 異常時にアラートを飛ばすようにして、迅速な対応を取れるようにしています。
- Error Tracking
- 週次で増えたエラーがないか確認しています。
ツールの良い点
- なんでもできる(豊富な機能)
- 直観的に使いやすい
ツールの課題点
- 料金体系が複雑
- Document 不足
ツールを検討されている方へ
APM として多種多様な機能が提供されているのでフルで活用できれば、システムの状態観測・監視によっぽど困ることはないと思います。 気をつけなければいけない点としては、従量課金なので課金体系が分かっていないとコストがかかりすぎてしまう点と、アップデートが頻繁に行われるので Release は逐一追う必要があります。
もし、OpenTelemetry を導入しつつ Datadog を利用する場合は弊社のテックブログが参考になるかと思います。
今後の展望
まだかなりコストがかかってしまっているのでコスト削減を行いたいのと、DatadogのPrivate Beta機能を積極的に試していきたいです。

株式会社Gaudiy / AndooBomber
バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
2019年: Yahoo株式会社に入社。FE→BE→SREを担当。 2022年: Gaudiy株式会社に入社。BE,SREを担当。
よく見られているレビュー

株式会社Gaudiy / AndooBomber
バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
2019年: Yahoo株式会社に入社。...
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法